|
按照类似逻辑,可以让人工智能根据其他动物学习和认识外界的过程,掌握动物语言,这样我们就可以和动物建立交流交流渠道。我们知道家养动物和主人能进行语言交流,但动物之间的交流肯定更复杂和丰富,如果我们能掌握了和动物的交流方式,尤其是和野生动物进行交流,我们人类就可以打开一个认识许多地球未知世界的新窗口,甚至会发现一个非常巨大的新知识宝库:动物源知识。
人工智能(AI)模型通过研究单个婴儿生命中一小部分的头戴摄像头记录,学会了识别“婴儿床”和“球”等单词。
结果表明,人工智能可以帮助我们理解人类是如何学习的,该研究的合著者、纽约大学人工智能研究员Wai Keen Vong说。Vong说,这在以前是不清楚的,因为其他语言学习模型,如ChatGPT,在数十亿个数据点上学习,这无法与婴儿的真实世界经历相提并论。“我们出生时没有得到互联网。
作者希望这项研究于2月1日发表在《科学》杂志上1,将引发关于儿童如何学习语言的长期争论。人工智能只能通过在它看到的图像和文字之间建立关联来学习;它没有使用任何其他关于语言的先验知识进行编程。Vong说,这挑战了一些认知科学理论,即为了赋予单词意义,婴儿需要一些关于语言如何运作的先天知识。
这项研究是理解儿童早期语言习得的“一种迷人的方法”,加州大学默塞德分校的认知科学家Heather Bortfeld说。
Vong和他的同事们使用安装在一个名叫Sam的男婴戴的头盔上的摄像机录制了61个小时的录音,从婴儿的角度收集经验。山姆住在澳大利亚阿德莱德附近,从六个月到两岁左右,他每周两次佩戴相机大约一个小时(大约占他清醒时间的1%)。
研究人员训练了他们的神经网络 - 一种受大脑结构启发的人工智能 - 在视频中的帧和从录音中转录下来的与山姆说的话上。该模型暴露在250,000个单词和相应的图像中,这些图像是在玩耍,阅读和吃饭等活动中捕获的。该模型使用了一种称为对比学习的技术来学习哪些图像和文本倾向于在一起,哪些则不然,以建立可用于预测某些单词(例如“球”和“碗”)所指的图像的信息。
为了测试人工智能,研究人员要求模型将一个单词与四个候选图像之一相匹配,该测试也用于评估儿童的语言能力。它在 62% 的时间内成功地对对象进行了分类——比偶然预期的 25% 要好得多,并且与在该数据集之外的 4 亿个图像文本对上训练的类似 AI 模型相当。
对于一些词,如“苹果”和“狗”,该模型能够正确地识别以前从未见过的例子——这通常是人类认为相对容易的。平均而言,它在 35% 的时间内成功做到了这一点。当对象在训练数据中频繁出现时,人工智能更善于识别脱离上下文的对象。Vong说,它最擅长识别外观变化不大的物体。可以指代各种不同物品的单词(例如“玩具”)更难学习。
关于学习的教训
Bortfeld说,该研究对单个儿童数据的依赖可能会引发对其研究结果的普遍性提出质疑,因为儿童的经历和环境差异很大。但她补充说,这项练习表明,在婴儿的早期,只要在不同的感觉来源之间形成关联,就可以学到很多东西。这些发现也对科学家提出了挑战,例如美国语言学家诺姆·乔姆斯基(Noam Chomsky),他们声称语言太复杂,信息输入太稀疏,无法通过一般学习过程进行语言习得。“这些是我看到的最有力的数据之一,表明这种'特殊'机制是不必要的,”Bortfeld说。
现实世界的语言学习比人工智能所经历的要丰富多样得多。研究人员表示,由于人工智能仅限于对静止图像和书面文本进行训练,因此它无法体验真实婴儿生活中固有的交互。例如,人工智能很难学习“手”这个词,这通常是在婴儿生命的早期学习的,Vong说。“婴儿有自己的双手,他们有很多经验。这绝对是我们模型中缺少的组成部分。
“进一步改进以使模型更符合人类学习的复杂性的潜力是巨大的,为认知科学的进步提供了令人兴奋的途径,”加拿大蒙特利尔大学的机器学习科学家Anirudh Goyal说。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 03:57
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社