dwchen的个人博客分享 http://blog.sciencenet.cn/u/dwchen

博文

DeepSeek的成功给我们的启示 精选

已有 9550 次阅读 2025-1-30 10:08 |个人分类:大模型|系统分类:科研笔记

最近,中国人工智能大模型DeepSeek横空出世,大大降低了成本,展现了极高的性价比。据说,DeepSeek仅用5%的训练成本,5%的硬件投入,5%的人力投入,就达到了美国最先进的AI大模型的水平。这让美国的芯片巨头的股价暴跌,让美国总统公开宣称美国企业要集中精力参与AI竞争,让美国首富不自信,怀疑DeepSeek撒谎。这也印证了我在2023年12月写的一篇博文“大模型带来的五大危害不可不察”的主要观点,现有大模型技术具有大投入、大能耗的突出问题,难以可持续发展[1]。该文目前阅读次数超过6000次。

那么,AI如何实现可持续发展呢? 我在2023年7月的一篇博文也系统分析了这个问题,并提出了研究的重点方向有6个:轻量化架构、高性能芯片、现有算法优化、下一代人工智能算法、大数据筛选技术和新型存储技术。如果方法得当、技术对头,在理想情况下,在保持AI系统性能不变的情况下,AI系统的总投入也许可以达到原来的千分之一[2]。没想到,DeepSeek已经这么快就实现了5%,真是可喜可贺。该文的阅读次数也超过了6000次。 千分之一是理想情况,现实情况估计是3%,我预测类似DeepSeek的AI大模型的成本还可以再降低一半。

我认为DeepSeek的成功关键在于自信自强、问题导向和系统思维。 开发DeepSeek必须要自信自强,没有自信自强,连想都不敢想,何况动手去做?  DeepSeek还坚持问题导向,致力于修改系统的框架,解决现有大模型算法效率不高、模型参数太多等问题。DeepSeek还非常有系统思维,知道大模型的性能不仅仅取决于硬性,而是一个系统工程,取决于硬件、算法、架构、优化、数据等多个方面。没有高性能硬件,就从其他方面下手,结果取得奇效。

DeepSeek给了我国科技届最重要的新年礼物,只要有创新自信并艰苦奋斗,我们一定能不断克服一个个卡脖子的理论和技术难题。不仅对于AI大模型,对于其他关键理论和核心技术,DeepSeek的成功也具有重要的参考价值。我相信,只要坚持自信自强、问题导向和系统思维,就没有解决不了的技术难题,就没有攻克不了的理论难关。

[1] https://blog.sciencenet.cn/blog-57940-1412633.html 

[2] https://blog.sciencenet.cn/blog-57940-1395586.html 



https://blog.sciencenet.cn/blog-57940-1470964.html

上一篇:不搞一个项目终身受用的帽子将激活创新热情
下一篇:假如DeepSeek创始人梁文锋申请国家级科研项目
收藏 IP: 223.104.41.*| 热度|

26 宁利中 张红光 檀成龙 毛善成 许培扬 张叔勇 葛及 张健旭 李剑超 王从彦 周忠浩 郑永军 李毅伟 雒运强 高友鹤 张成岗 史晓雷 钟茂初 曾杰 钟定胜 崔锦华 晏成和 胡大伟 张学文 梁洪泽 guest06369125

该博文允许注册用户评论 请点击登录 评论 (13 个评论)

IP: 120.235.157.*   回复 | 赞 +1 [6]曾杰   2025-1-31 07:44
人类的知识体系
- 普遍知识的文化https://blog.sciencenet.cn/blog-709494-1451546.html - 理性知识的历史与哲学和数学等,发展到科学https://mp.weixin.qq.com/s/sg6iR-tfN7QVIKmbXk0qbg,并带来了检索与编辑知识的人工智能,及其产业化的生态,等。
在欧洲建立了1-自然科学和2-社会科学,在美国上个世纪开创了3-人工科学,
并形成了 - 意大利-法国与实验医学-美国-中国与系统医学的发展https://blog.sciencenet.cn/blog-627429-1410248.html
生命系统的机理是什么?如何人工设计生命机器人?及人类探索这一对问题的历史过程是什么?
探索系统与合成生物学 - 及其自然与人工https://mp.weixin.qq.com/s/A8CAuGJ5RV6R6j-kDJpZPg的泛进化理论,
从一开始就是交叉综合学科 - 物理学理论应用和计算机科学与生命科学交融,
并探讨知识社会学https://mp.weixin.qq.com/s/0Ni6ddKsVDuJXhWMiIhHOQ - 科学和技术与社会经济的关系,及其带来的三次机器革命https://mp.weixin.qq.com/s/eTDM1wKK3VrMoP7zlldBOw - a-机械与电气化,b-自动化与信息化,c-人工智能https://mp.weixin.qq.com/s/1UK-XpDT3tPsOtAssguRPw与合成生物 - 生命机器时代https://mp.weixin.qq.com/s/x4_02IfL8RR1szESo8hYPA
回复  从丝绸之路到大航海 - 泉州https://blog.sciencenet.cn/blog-107667-1443474.html与威尼斯https://blog.sciencenet.cn/blog-107667-1451826.html
在近代欧洲 - 建立了实证科学https://wenku.baidu.com/view/e06347161fd9ad51f01dc281e53a580216fc5094.html,在欧美现代 - 科学思想转向https://www.doc88.com/p-509932323404.html
并形成了世界三大经济中心https://blog.sciencenet.cn/blog-1352130-1439965.html
等。
2025-1-31 08:541 楼(回复楼主) 赞 +1 | 回复
回复  以后的人类尴尬了,啥事都问AI,每次答案都不同,信谁的??
2025-2-1 09:472 楼(回复 1 楼) 赞 +1 | 回复
IP: 223.11.183.*   回复 | 赞 2 +1 [5]李毅伟   2025-1-30 21:09
DeepSeek 的低成本是建立在先前 Open AI 等的资金投入和技术积累之上。

(必须承认,人工智能在美国过于炒作出现泡沫也是有的,DeepSeek 无心插柳挤了一波泡沫!)
回复  泡沫太大了,还可以简化50%
2025-2-1 09:461 楼(回复楼主) 赞 +1 | 回复
IP: 111.199.83.*   回复 | 赞 +1 [4]周忠浩   2025-1-30 19:06
大投入的,不断总结出规则,夯实基础,也会持续进步。限于条件,另谋可行,也是好的选择。
回复  聚焦前沿,独辟蹊径!
2025-2-1 09:461 楼(回复楼主) 赞 +1 | 回复
IP: 111.199.83.*   回复 | 赞 +1 [3]周忠浩   2025-1-30 19:03
  
回复  谢谢!
2025-2-1 09:451 楼(回复楼主) 赞 +1 | 回复
IP: 111.194.202.*   回复 | 赞 +1 [2]张健旭   2025-1-30 16:26
简单的创新更有用,
回复  不简单啊,挺创新的
2025-2-1 09:431 楼(回复楼主) 赞 +1 | 回复
IP: 120.244.61.*   回复 | 赞 2 +1 [1]胡大伟   2025-1-30 13:42
AI的构建需要天量的数据和算力,还要消耗巨大的电能。Deek居然用这么少的数据和算力,就能训练好海量的参数,就能真是创造了奇迹。
然而,人脑150亿个神经元,耗电仅30瓦,就能学习、训练得这么完美。可见AI依然有很长的路要走。
回复  对,还可以简化
2025-2-1 09:431 楼(回复楼主) 赞 +1 | 回复

1/1 | 总计:6 | 首页 | 上一页 | 下一页 | 末页 | 跳转

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-2-19 06:23

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部