《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵，插队修地球，1991年去国离乡，不知行止。

博文

DeepSeek爆火真相：不靠“人盯”，让AI自己学会慢思考: 热度 2 2025-2-15 11:01; 本文整理自InfoQ策划的DeepSeek系列直播第二期节目——DeepSeek爆火背后DeepSeek，纯强化学习路线到底有何不同。在直播中，出门问问大模型团队前工程副总李维博士聚焦推理范式的创新，分析了R1Zero对推理模型平民化的创新贡献。他提到，DeepSeek通过开源和透明化，证明了不需要过程监督，仅通过结果控制就能训 ...; 个人分类: AI 浪潮|13778 次阅读|1 个评论热度 2

1 ... 11 12 13 141516 17 18 19 ... 498 下一页

李维

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-3-3 00:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部