||
最近,中国人工智能大模型DeepSeek横空出世,大大降低了成本,展现了极高的性价比。据说,DeepSeek仅用5%的训练成本,5%的硬件投入,5%的人力投入,就达到了美国最先进的AI大模型的水平。这让美国的芯片巨头的股价暴跌,让美国总统公开宣称美国企业要集中精力参与AI竞争,让美国首富不自信,怀疑DeepSeek撒谎。这也印证了我在2023年12月写的一篇博文“大模型带来的五大危害不可不察”的主要观点,现有大模型技术具有大投入、大能耗的突出问题,难以可持续发展[1]。该文目前阅读次数超过6000次。
那么,AI如何实现可持续发展呢? 我在2023年7月的一篇博文也系统分析了这个问题,并提出了研究的重点方向有6个:轻量化架构、高性能芯片、现有算法优化、下一代人工智能算法、大数据筛选技术和新型存储技术。如果方法得当、技术对头,在理想情况下,在保持AI系统性能不变的情况下,AI系统的总投入也许可以达到原来的千分之一[2]。没想到,DeepSeek已经这么快就实现了5%,真是可喜可贺。该文的阅读次数也超过了6000次。 千分之一是理想情况,现实情况估计是3%,我预测类似DeepSeek的AI大模型的成本还可以再降低一半。
我认为DeepSeek的成功关键在于自信自强、问题导向和系统思维。 开发DeepSeek必须要自信自强,没有自信自强,连想都不敢想,何况动手去做? DeepSeek还坚持问题导向,致力于修改系统的框架,解决现有大模型算法效率不高、模型参数太多等问题。DeepSeek还非常有系统思维,知道大模型的性能不仅仅取决于硬性,而是一个系统工程,取决于硬件、算法、架构、优化、数据等多个方面。没有高性能硬件,就从其他方面下手,结果取得奇效。
DeepSeek给了我国科技届最重要的新年礼物,只要有创新自信并艰苦奋斗,我们一定能不断克服一个个卡脖子的理论和技术难题。不仅对于AI大模型,对于其他关键理论和核心技术,DeepSeek的成功也具有重要的参考价值。我相信,只要坚持自信自强、问题导向和系统思维,就没有解决不了的技术难题,就没有攻克不了的理论难关。
[1] https://blog.sciencenet.cn/blog-57940-1412633.html
[2] https://blog.sciencenet.cn/blog-57940-1395586.html
1/1 | 总计:6 | 首页 | 上一页 | 下一页 | 末页 | 跳转 |
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-2-19 06:23
Powered by ScienceNet.cn
Copyright © 2007-2025 中国科学报社