||
DeepSeek就像射雕英雄传里的郭靖一样,打掉了AGI中“大模型需要大算力”的幻象。将DeepSeek比作《射雕》中郭靖的武学之道,初步揭示了一个深刻的AI发展启示——“真正的智能突破未必依赖“功力堆砌”,而在于对"武学本质"的领悟”。对于智能与AI而言,数据、算法、算力、知识固然重要,如何有效地使用数据、算法、算力、知识则更重要。
当地时间1月27日,美股三大股指低开,道指跌0.8%,标普500指数跌2.2%,纳指跌3.6%。DeepSeek引发芯片股估值担忧,半导体股大幅下挫,英伟达跌超11%,台积电跌超9%,博通跌超11%,阿斯麦跌超8%,美光跌超8%。美股大型科技股走低,微软跌超3%,亚马逊、Meta、特斯拉跌超2%。有机构分析称,由于美股整体估值还存在进一步消化空间,预计未来一段时间美股大盘将出现震荡。
一、降龙十八掌的启示:重剑无锋,大巧不工
郭靖修炼降龙十八掌时,洪七公强调"劲力收发由心",这恰似大模型训练中对算力的精准调度:
1)招式精炼化:正如郭靖将复杂招式凝练为"亢龙有悔"的核心劲力,DeepSeek通过稀疏化架构(如MoE)实现参数动态激活,避免全量计算的"蛮力消耗";
2)内力循环系统:与郭靖在蒙古草原的呼吸吐纳法类比,模型通过梯度累积、混合精度训练等技术,构建算力资源的"周天循环",提升能源转化效率;
3)实战反馈机制:如同郭靖在实战中不断修正掌法,强化学习与课程学习策略使模型在有限算力下实现"经验值"最大化。
二、"九阴真经"的隐喻:大道至简,返璞归真
黄裳创作《九阴真经》时参透武学本质的经历,映射出DeepSeek对AGI核心能力的解构:
1、总纲优先原则:就像郭靖先领悟梵文总纲再练具体招式,DeepSeek可能通过元学习框架抓住"可解释性"这一AGI总纲,避免在无意义参数空间盲目探索;
2、阴阳互济思想:受"天之道损有余而补不足"启发,模型架构设计注重记忆模块与推理模块的动态平衡,而非单纯扩大网络宽度;
3、独孤九剑式破绽洞察:如同风清扬教令狐冲看透招式本质,通过对抗训练和因果推理挖掘数据深层规律,用"算法巧劲"替代"算力硬拼"。
三、"侠之大者"的终极境界:以人为本,道术合一
郭靖守襄阳展现的"为国为民"境界,暗示着AGI发展的终极价值取向:
1、轻功草上飞:就像郭靖不用内力踏雪无痕,模型通过知识蒸馏将大模型能力迁移到轻量化终端,实现普惠智能;
2、武穆遗书智谋:借鉴岳飞兵法中"运用之妙,存乎一心",在少样本学习场景中展现人类级别的策略适应性;
3、蒙古摔跤启示:郭靖将草原搏击术融入中原武学,正如多模态融合技术打破单一模态的数据依赖,用更"节能"的方式实现通用理解。
这种武侠思维对AI发展的启示,恰如张三丰教张无忌太极拳时所说的"忘其形而得其意"。当行业还在比拼"功力深浅"(算力规模)时,DeepSeek已然在探索"武学真谛"(智能本质)——这或许才是通向AGI的"华山论剑"正途。
再有,DeepSeek开放共享的开源模式非常重要,它让全球的研究者得以站在巨人的肩膀上,不再固步自封,而是互相借鉴,共同进步,进而推动人-AI-环境系统智能技术朝着更健康、更普惠的方向发展。
另外,毋庸置疑,DeepSeek本身还有不少缺陷,比如多模态交互较差、还不会跨域的算计、人机环境系统协同不完善等等,但是瑕不掩瑜,它通过“小”算力、“少”数据实现了“大”算法,挑战了“大模型必须大算力”的教条主义和传统的AGI人才观,更重要的是,它在一定程度上穿越了5000亿刀的“星际之门”及动摇了某些领先者的信心……射掉了那些有时看得见有时看不见“雕”与hawk们!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-2-3 22:57
Powered by ScienceNet.cn
Copyright © 2007-2025 中国科学报社