科学网—liwei999的博文 - 第16页

设为首页收藏本站

开启辅助访问切换到宽版

科学网 › 我的中心 › 博文 › liwei999的博文

liwei999

https://blog.sciencenet.cn/?362400

从R1幻觉谈起，大模型幻觉是缺陷还是创意火花？: 李维 2025-2-10 02:17; 主持人：大家好，欢迎来到今天的访谈。最近，大模型的“幻觉”问题引发了热议，尤其是DeepSeek-R1，它的幻觉率似乎比自己的基座大模型DeepSeek-V3高不少。今天我们请到了资深AI研究员立委博士，来跟大家聊聊这个话题。立委，您好！立委：主持人好，大家好！主持人：老李，咱们先来个灵魂拷问 ...; 个人分类: AI 浪潮|8705 次阅读|1 个评论

推理强化模型中思维链的本质: 热度 2 李维 2025-2-8 04:11; DeepSeek R1 的出圈是近来最大热度的焦点。它不仅在数学、代码等强推理能力上追平了 OpenAI 头部推理模型 o 系列，而且在语言文字的创造力和模仿力方面产生让人惊艳的效果。尤其是在中文（国学）的能力方面，大家都体会到了奇迹般的能力跃升。这一切都要感谢推理强化的 CoT（思维链）。CoT 为什么这么有效，这么神奇，文 ...; 个人分类: AI 浪潮|8465 次阅读|2 个评论热度 2

推理强化学习是端到端的监督，推理过程的非监督: 热度 1 李维 2025-2-1 14:00; DeepSeek R1 的数学和代码数据究竟是有监督还是无监督？是人造数据还是再生数据？很多人其实没究细节：实际上这些数据是人造也是再生，是监督学习，也是非监督学习（强化学习）。怎么讲？这些训练数据，从源头和结果（黄金标准）上看，是地地道道的人造数据。用的是各种数学测试题，以及 github 开源社区的人类（码 ...; 个人分类: AI 浪潮|8516 次阅读|1 个评论热度 1

1 ... 12 13 14 151617 18 19 20 ... 498 下一页

会议

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-3-1 10:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部