这款 Gemini 1.5 Pro 驱动的免费应用,会给你的科研带来什么样的帮助?
我在得到开设视频课,讲授如何用 AI 辅助读写论文后,看到过读者提问:
王老师,能否讲讲如何对多篇文献进行综合分析回顾呢?
今天咱们就来谈一谈这个问题。首先我给你介绍一下咱们准备使用的工具。
探索 今年 1 月份,我和涂子沛老师见面聊天时,他问了我一个问题:
树义,你有没有关注过 Google 的那款知识管理产品?
当时我有点懵,回答道:Google 的知识管理产品?是 Google Keep 吗?
他说不是,是最近结合大语言模型的那个。
我当时没反应过来,但涂老师稍微提示了一下,我就突然明白过来了。其实这款应用我不仅关注了,还专门做了笔记。当场我翻找 Heptabase 笔记,很快找到了。
我给涂老师展示了一下这则笔记,问:您说的是不是这个 Google NotebookLM?我还特意给他看了时间戳,是 2023 年 12 月份的记录下来的。
只不过,这则 Heptabase 笔记只能证明我关注过 NotebookLM 这款应用,但其实当时我并不看好它。原因很简单 —— 彼时它不支持中文,对我这样经常处理中文的用户来说,用处着实受限。
但我后来还真用过 NotebookLM ,用途是处理英文长文档。最典型的例子是今年 2 月份的 OpenAI Sora 发布,我很快也写了一篇论文。目前是网络首发状态,而 CNKI 上下载量已经超过 2000 了。
在写论文过程中,我们当然需要查阅资料。Sora 的几篇相关英文文档和论文都比较长,于是我把它们交给了 NotebookLM。例如当时针对这些信源,我提出了问题:「请总结一下 Sora 的新结构」,NotebookLM 回答说「Sora 的新型架构将变压器操作应用于时空补丁,使其能够生成持续时间、分辨率和宽高比可变的视频和图像」。
看到这里,你可能会觉得 NotebookLM 可以处理中文啊,而且处理得还挺好嘛。但其实这是因为我用了一个叫做 Immersive Translate 的插件,它可以把网页上的所有内容对照翻译成中文而已。当时 NotebookLM 确实处理不好中文。
写完这篇文章后,我基本上就把 NotebookLM 扔到一边了。毕竟在更多的日常情境下,我需要使用能够认得中文的大语言模型嘛。
升级 好在这次更新,Google 把 NotebookLM 升级成由 Gemini 1.5 Pro 驱动。
Gemini 1.5 Pro 这款模型你应该并不陌生,因为前些日子 我刚给你演示过用它来看视频写小小说 。
在那篇文章里,我给你演示过这款大语言模型的中文能力有多强。它支持 100 万 token 的上下文窗口,大海捞针信息搜寻依然准确,非常惊艳。
因为 NotebookLM 换成了 Gemini 1.5 Pro ,中文处理就不再是问题了。加上支持长百万级别上下文还免费,NotebookLM 的价值就立即突显出来了。
下面咱们用多篇文献一起放进去,做个测试。
测试 我在这里使用了 4 篇文献,来测试 NotebookLM 新版是否好用。这 4 篇文献分别为:
这都是我近 3 年内发表的论文。有的跟 AI 相关,有的涉及知识管理工具。
我把这四篇论文一股脑儿输入进 NotebookLM ,作为来源文献。然后咱们把 4 个文献都勾选上,开始提问让它综合分析。
提问 我提的第一个问题是「详细说明来源文献中论述的人脑记忆缺陷的问题」。NotebookLM 直接定位到《面向科研工作赋能的笔记类个人知识管理工具研究》这篇文章,找寻其中讨论的人脑记忆缺陷问题。
答案中提到文章指出「人脑在某些情况下会发生信息过载」,进而引发「认知负荷」等,并且说明在第 652 页。然后提到「过载会影响选择与处理,导致信息规避」。NotebookLM 还自动用黑体标示了重要词汇,非常有意思。
每一条答案后的页码,都可以看出这些答案有原文依据,不是凭空捏造的。文章还提到了「信息偶遇」,可以「被动唤醒记忆」。这都与记忆缺陷相关。我很满意,可惜来源都锁定在单篇文献里。
于是我又问了第二个问题:「详细说明来源文献中论述的 AI 赋能的问题」。
这次 NotebookLM 首先找到了《AIGC 时代的科研工作流:协同与 AI 赋能视角下的数字学术工具应用及其未来》一文,因为这篇文章和主题最为相近,也确实有 3 条答案都出自该文。
值得注意的是,NotebookLM 列出的答案又不仅仅来自于单一文献,还包括「大幅提升工作效率,缩短研究成果生产周期」,这来自《ChatGPT 给科研工作者带来的机遇与挑战》一文的第 115 页。这充分证明了 NotebookLM 检索资料时候的综合能力。
最有意思的是最后还有一个小节。NotebookLM 提到《面向科研工作赋能的笔记类个人知识管理工具研究》,指出「这一篇文献主要关注图数据库驱动的知识管理工具特性,没有专门论述 AI 赋能问题」。
既然「没有论述 AI 赋能」,为什么要作为答案列出?因为这虽然不是 AI 赋能,但它指出「这些特性可以显著提升知识管理工具的能力范围」,这依然是「赋能」嘛。有意思,NotebookLM 似乎并不是教条地反馈答案,而是在揣度我们究竟想要的是什么。
我又提出了第三个问题,意图在于查看 NotebookLM 综合评价分析 能力:
以科研人员的实际需求来说,目前 AI 和技术工具可以在哪些环节提升效率?在哪些环节和任务上还有欠缺?」
NotebookLM 首先回答了提升部分问题。这里首先拿出来《ChatGPT 给科研工作者带来的机遇与挑战》一文,提到了编程、阅读和写作等方面 AI 提升效率的方式,并且都给出来了页码。
接下来是不足之处。还是在同一篇文献中,NotebookLM 提到「回答的真实性问题」、「数据污染问题」、「隐私和数据安全问题」,也都有页码标示。
这还没完,NotebookLM 继续说,《AIGC 时代的科研工作流:协同与 AI 赋能视角下的数字学术工具应用及其未来》一文论述了「AI 工具目前不能找寻关键问题、形成最终决策」。还来了一句「换言之」:
AI 工具可以作为辅助工具提升科研效率,但不能代替科研人员的思考和判断」。
我觉得 NotebookLM 总结得非常好。如果我在课堂上提问时,学生能答得这么条理清晰,并能提供充足的证据,我会判断他事先做足了功课…… 或者使用了 NotebookLM,哈哈。
另外请注意,NotebookLM 每次给出的答案,都可以作为笔记起来,作为你后续问答的来源(source),你也可以对其进行编辑处理。这样你就可以用滚雪球的方式,积攒自己的个性化问题与思考答案了。
发现 我是怎么发现 NotebookLM 这次大升级呢? OpenAI 发布的 GPT-4o 模型实在太吸引眼球了,所以大家可能忘了第二天还有个重要事件,那就是 Google I/O 2024。
我就是在大会主题演讲中发现的 NotebookLM 更新后台模型。演讲者演示了 NotebookLM 的功能,看完后我不知道应该用眼前一亮,还是眼前一黑来形容。
演示的内容,是 NotebookLM 未来将会支持的多模态效果。到时它能干什么呢?
你把资料堆进来,NotebookLM 自己根据这些资料总结,并且根据你的需求,设定专属讲述方案。而且还是用两个人对话的方式(类似于对口相声),来给你进行寓教于乐形式的语音讲解。
这还不算,你还可以选择「加入」,进行语音提问。演讲者演示的,是让 NotebookLM 给他的儿子讲牛顿力学,指明要求用篮球为例子,因为孩子喜欢篮球。于是 NotebookLM 立即就开始用墙边的篮球为什么能够不运动来讲解,说明力的平衡作用,非常生动,而且音色、语气等因素也让学习者感受到了足够的关注和鼓励。
从前我们提到的「第二大脑」,往往是指把你的笔记合理积攒和组织起来,然后你可以跟它「对话」。但是从前所谓的对话,还仅仅是去阅读浏览思索,然后补充内容,链接卡片,扩展补充,阐释输出…… 但是现在,你真的可以和自己的「第二大脑」对话了,对,用语音。甚至将来,很可能你的表情也会被 AI 准确识别,从而在你一颦一笑中,发现你的疑惑,给你不同的讲解方式和辅导。
你明白我为什么眼前一亮了吧?因为很有可能,这将带来低成本个性化的学习辅导,以及「母慈子孝」的家庭环境。
但是我为什么会眼前一黑呢?因为你别忘了,我自己的职业是教师啊。😂
让我跟大语言模型比耐心、学习能力?别说这些了,就连「说多少话嗓子都不会痛」这点儿,我就不是它对手啊。
小结 本文我给你介绍了如何用 NotebookLM 这款免费应用综合分析多篇中文文献,回答用户具体问题,并且给出足够扎实原文证据的方法。我非常建议你动手尝试一下 NotebookLM ,也建议你认真看看 Google I/O 2024 的全部 Keynote 视频,感受一下「未来已来」的冲击。
不过目前 NotebookLM 还没有正式推出多模态功能给普通用户,咱们还得再等等。另外,如果你希望不必每次都上传内容给 NotebookLM 进行分析,咱们还可以 直接构建本地版的 AI 第二大脑 。
如果你觉得本文有用,请点赞 。
如果本文可能对你的朋友有帮助,请转发 给他们。
欢迎关注 我的专栏 ,以便及时收到后续的更新内容。
延伸阅读
转载本文请联系原作者获取授权,同时请注明本文来自王树义科学网博客。 链接地址: https://blog.sciencenet.cn/blog-377709-1434900.html
上一篇:
如何用「竞争」与「作品」助力成长?读《工作的心智》有感 下一篇:
开源免费 AI 朗读中文,居然也能以假乱真了?