wshuyi的个人博客分享 http://blog.sciencenet.cn/u/wshuyi

博文

如何用 NotebookLM 综合分析多篇文献? 精选

已有 6661 次阅读 2024-5-20 20:47 |系统分类:科研笔记

这款 Gemini 1.5 Pro 驱动的免费应用,会给你的科研带来什么样的帮助?

我在得到开设视频课,讲授如何用 AI 辅助读写论文后,看到过读者提问:

王老师,能否讲讲如何对多篇文献进行综合分析回顾呢?

今天咱们就来谈一谈这个问题。首先我给你介绍一下咱们准备使用的工具。

探索

今年 1 月份,我和涂子沛老师见面聊天时,他问了我一个问题:

树义,你有没有关注过 Google 的那款知识管理产品?

当时我有点懵,回答道:Google 的知识管理产品?是 Google Keep 吗?

他说不是,是最近结合大语言模型的那个。

我当时没反应过来,但涂老师稍微提示了一下,我就突然明白过来了。其实这款应用我不仅关注了,还专门做了笔记。当场我翻找 Heptabase 笔记,很快找到了。

我给涂老师展示了一下这则笔记,问:您说的是不是这个 Google NotebookLM?我还特意给他看了时间戳,是 2023 年 12 月份的记录下来的。

只不过,这则 Heptabase 笔记只能证明我关注过 NotebookLM 这款应用,但其实当时我并不看好它。原因很简单 —— 彼时它不支持中文,对我这样经常处理中文的用户来说,用处着实受限。

但我后来还真用过 NotebookLM ,用途是处理英文长文档。最典型的例子是今年 2 月份的 OpenAI Sora 发布,我很快也写了一篇论文。目前是网络首发状态,而 CNKI 上下载量已经超过 2000 了。

在写论文过程中,我们当然需要查阅资料。Sora 的几篇相关英文文档和论文都比较长,于是我把它们交给了 NotebookLM。例如当时针对这些信源,我提出了问题:「请总结一下 Sora 的新结构」,NotebookLM 回答说「Sora 的新型架构将变压器操作应用于时空补丁,使其能够生成持续时间、分辨率和宽高比可变的视频和图像」。

看到这里,你可能会觉得 NotebookLM 可以处理中文啊,而且处理得还挺好嘛。但其实这是因为我用了一个叫做 Immersive Translate 的插件,它可以把网页上的所有内容对照翻译成中文而已。当时 NotebookLM 确实处理不好中文。

写完这篇文章后,我基本上就把 NotebookLM 扔到一边了。毕竟在更多的日常情境下,我需要使用能够认得中文的大语言模型嘛。

升级

好在这次更新,Google 把 NotebookLM 升级成由 Gemini 1.5 Pro 驱动。

Gemini 1.5 Pro 这款模型你应该并不陌生,因为前些日子 我刚给你演示过用它来看视频写小小说

在那篇文章里,我给你演示过这款大语言模型的中文能力有多强。它支持 100 万 token 的上下文窗口,大海捞针信息搜寻依然准确,非常惊艳。

因为 NotebookLM 换成了 Gemini 1.5 Pro ,中文处理就不再是问题了。加上支持长百万级别上下文还免费,NotebookLM 的价值就立即突显出来了。

下面咱们用多篇文献一起放进去,做个测试。

测试

我在这里使用了 4 篇文献,来测试 NotebookLM 新版是否好用。这 4 篇文献分别为:

  • ChatGPT给科研工作者带来的机遇与挑战

  • 图数据库驱动的知识管理应用特性对比研究——以Roam Research为例

  • AIGC时代的科研工作流:协同与AI赋能视角下的数字学术工具应用及其未来

  • 面向科研工作赋能的笔记类个人知识管理工具研究

这都是我近 3 年内发表的论文。有的跟 AI 相关,有的涉及知识管理工具。

我把这四篇论文一股脑儿输入进 NotebookLM ,作为来源文献。然后咱们把 4 个文献都勾选上,开始提问让它综合分析。

提问

我提的第一个问题是「详细说明来源文献中论述的人脑记忆缺陷的问题」。NotebookLM 直接定位到《面向科研工作赋能的笔记类个人知识管理工具研究》这篇文章,找寻其中讨论的人脑记忆缺陷问题。

答案中提到文章指出「人脑在某些情况下会发生信息过载」,进而引发「认知负荷」等,并且说明在第 652 页。然后提到「过载会影响选择与处理,导致信息规避」。NotebookLM 还自动用黑体标示了重要词汇,非常有意思。

每一条答案后的页码,都可以看出这些答案有原文依据,不是凭空捏造的。文章还提到了「信息偶遇」,可以「被动唤醒记忆」。这都与记忆缺陷相关。我很满意,可惜来源都锁定在单篇文献里。

于是我又问了第二个问题:「详细说明来源文献中论述的 AI 赋能的问题」。

这次 NotebookLM 首先找到了《AIGC 时代的科研工作流:协同与 AI 赋能视角下的数字学术工具应用及其未来》一文,因为这篇文章和主题最为相近,也确实有 3 条答案都出自该文。

值得注意的是,NotebookLM 列出的答案又不仅仅来自于单一文献,还包括「大幅提升工作效率,缩短研究成果生产周期」,这来自《ChatGPT 给科研工作者带来的机遇与挑战》一文的第 115 页。这充分证明了 NotebookLM 检索资料时候的综合能力。

最有意思的是最后还有一个小节。NotebookLM 提到《面向科研工作赋能的笔记类个人知识管理工具研究》,指出「这一篇文献主要关注图数据库驱动的知识管理工具特性,没有专门论述 AI 赋能问题」。

既然「没有论述 AI 赋能」,为什么要作为答案列出?因为这虽然不是 AI 赋能,但它指出「这些特性可以显著提升知识管理工具的能力范围」,这依然是「赋能」嘛。有意思,NotebookLM 似乎并不是教条地反馈答案,而是在揣度我们究竟想要的是什么。

我又提出了第三个问题,意图在于查看 NotebookLM 综合评价分析能力:

以科研人员的实际需求来说,目前 AI 和技术工具可以在哪些环节提升效率?在哪些环节和任务上还有欠缺?」

NotebookLM 首先回答了提升部分问题。这里首先拿出来《ChatGPT 给科研工作者带来的机遇与挑战》一文,提到了编程、阅读和写作等方面 AI 提升效率的方式,并且都给出来了页码。

接下来是不足之处。还是在同一篇文献中,NotebookLM 提到「回答的真实性问题」、「数据污染问题」、「隐私和数据安全问题」,也都有页码标示。

这还没完,NotebookLM 继续说,《AIGC 时代的科研工作流:协同与 AI 赋能视角下的数字学术工具应用及其未来》一文论述了「AI 工具目前不能找寻关键问题、形成最终决策」。还来了一句「换言之」:

AI 工具可以作为辅助工具提升科研效率,但不能代替科研人员的思考和判断」。

我觉得 NotebookLM 总结得非常好。如果我在课堂上提问时,学生能答得这么条理清晰,并能提供充足的证据,我会判断他事先做足了功课…… 或者使用了 NotebookLM,哈哈。

另外请注意,NotebookLM 每次给出的答案,都可以作为笔记起来,作为你后续问答的来源(source),你也可以对其进行编辑处理。这样你就可以用滚雪球的方式,积攒自己的个性化问题与思考答案了。

发现

我是怎么发现 NotebookLM 这次大升级呢? OpenAI 发布的 GPT-4o 模型实在太吸引眼球了,所以大家可能忘了第二天还有个重要事件,那就是 Google I/O 2024。

我就是在大会主题演讲中发现的 NotebookLM 更新后台模型。演讲者演示了 NotebookLM 的功能,看完后我不知道应该用眼前一亮,还是眼前一黑来形容。

演示的内容,是 NotebookLM 未来将会支持的多模态效果。到时它能干什么呢?

你把资料堆进来,NotebookLM 自己根据这些资料总结,并且根据你的需求,设定专属讲述方案。而且还是用两个人对话的方式(类似于对口相声),来给你进行寓教于乐形式的语音讲解。

这还不算,你还可以选择「加入」,进行语音提问。演讲者演示的,是让 NotebookLM 给他的儿子讲牛顿力学,指明要求用篮球为例子,因为孩子喜欢篮球。于是 NotebookLM 立即就开始用墙边的篮球为什么能够不运动来讲解,说明力的平衡作用,非常生动,而且音色、语气等因素也让学习者感受到了足够的关注和鼓励。

从前我们提到的「第二大脑」,往往是指把你的笔记合理积攒和组织起来,然后你可以跟它「对话」。但是从前所谓的对话,还仅仅是去阅读浏览思索,然后补充内容,链接卡片,扩展补充,阐释输出…… 但是现在,你真的可以和自己的「第二大脑」对话了,对,用语音。甚至将来,很可能你的表情也会被 AI 准确识别,从而在你一颦一笑中,发现你的疑惑,给你不同的讲解方式和辅导。

你明白我为什么眼前一亮了吧?因为很有可能,这将带来低成本个性化的学习辅导,以及「母慈子孝」的家庭环境。

但是我为什么会眼前一黑呢?因为你别忘了,我自己的职业是教师啊。😂

让我跟大语言模型比耐心、学习能力?别说这些了,就连「说多少话嗓子都不会痛」这点儿,我就不是它对手啊。

小结

本文我给你介绍了如何用 NotebookLM 这款免费应用综合分析多篇中文文献,回答用户具体问题,并且给出足够扎实原文证据的方法。我非常建议你动手尝试一下 NotebookLM ,也建议你认真看看 Google I/O 2024 的全部 Keynote 视频,感受一下「未来已来」的冲击。

不过目前 NotebookLM 还没有正式推出多模态功能给普通用户,咱们还得再等等。另外,如果你希望不必每次都上传内容给 NotebookLM 进行分析,咱们还可以 直接构建本地版的 AI 第二大脑

如果你觉得本文有用,请点赞

如果本文可能对你的朋友有帮助,请转发给他们。

欢迎关注我的专栏,以便及时收到后续的更新内容。

延伸阅读



https://blog.sciencenet.cn/blog-377709-1434900.html

上一篇:如何用「竞争」与「作品」助力成长?读《工作的心智》有感
下一篇:开源免费 AI 朗读中文,居然也能以假乱真了?
收藏 IP: 218.68.123.*| 热度|

3 郑永军 汪运山 高煜

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 00:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部