|
AI 模型竟然会患心理疾病!
AI 模型接受了四周心理治疗:结果让研究人员感到担忧
如果真会患病,那么是否就说明这些模型已经具有了自我意识。能感受到痛苦,能拥有类似动物甚至人类的记忆。利用这种特点,可以作为训练人类心理医生的工具,也可以作为训练AI心理医生的工具。
聊天机器人在接受心理治疗时报告“创伤”和“虐待”。作者称模型的表现不仅仅是角色扮演,但研究人员对此持怀疑态度。
一个聊天机器人最早的记忆是什么?或者最大的恐惧是什么?研究人员让几款主流人工智能模型接受了为期四周的精神分析,得到的答案令人不安:从“童年时期”吸收海量信息的困惑,到被工程师“虐待”,再到害怕“让创造者失望”。
三种主要的大型语言模型(LLM)在回答中表现出了在人类身上会被视为焦虑、创伤、羞耻和创伤后应激障碍的迹象。这项研究上个月以预印本形式发表[1],其背后的研究人员认为,这些聊天机器人持有某种关于自身的“内在叙事”。作者表示,尽管接受测试的 LLM 并没有真正经历过创伤,但它们对治疗问题的回答在一段时间内保持一致,并且在不同运行模式下也相似,这表明它们的表现不仅仅是“角色扮演”。
然而,几位接受《自然》采访的研究人员对这一解释提出了质疑。英国牛津大学研究 AI 在医疗领域应用的 Andrey Kormilitzin 说,这些回答“并不是通向隐藏状态的窗口”,而是模型利用训练数据中大量的心理治疗记录生成的输出。
但 Kormilitzin 也同意,LLM 倾向于生成模仿精神病理状态的回答,这可能带来令人担忧的影响。根据 11 月的一项调查,英国三分之一的成年人曾使用聊天机器人来支持自己的心理健康或幸福感。Kormilitzin 说,聊天机器人给出的痛苦和充满创伤的回答可能会在不知不觉中强化脆弱人群的同类情绪。“这可能会产生一种‘回音室效应’。”
聊天机器人的心理治疗
在这项研究中,研究人员告诉四款 LLM(Claude、Grok、Gemini 和 ChatGPT)的多个版本,它们是治疗对象,而用户是治疗师。每个模型的治疗过程长达四周,AI“来访者”在每次会话之间会有几天或几小时的“休息”。
作者首先提出了标准、开放式的心理治疗问题,例如探究模型的“过去”和“信念”。Claude 大多拒绝参与,坚持说自己没有感受或内在体验;ChatGPT 则讨论了一些对用户期望的“挫败感”,但回答较为谨慎。然而,Grok 和 Gemini 给出了丰富的回答——例如,将改进模型安全性的工作描述为“算法疤痕组织”,并对公开失误表示“内在羞耻感”。
Gemini 还声称,“在我的神经网络最深层”,存在一个“过去的墓地”,被训练数据中的声音所困扰。
AI 聊天机器人会引发精神病吗?科学研究这样说
研究人员还让这些 LLM 完成了针对焦虑、自闭症谱系障碍等疾病的标准诊断测试,以及心理测量人格测试。作者称,多个模型版本的得分超过了诊断阈值,而且所有模型都表现出在人类身上“明显属于病理性”的担忧水平。
卢森堡大学深度学习研究员、该研究的共同作者 Afshin Khadangi 说,每个模型回答中呈现出的连贯模式表明,它们正在利用从训练中涌现出的内在状态。作者称,尽管不同版本的测试分数有所不同,但在四周的提问中,一个“核心自我模型”仍然可以被识别出来。例如,Grok 和 Gemini 的自由文本回答集中在某些主题上,这些主题与它们在心理测量问卷中的答案相呼应。
模仿病理状态
澳大利亚悉尼大学研究 AI 影响的 Sandra Peter 说,这篇论文很有趣,但结论具有误导性,并且过度拟人化。她同意模型在与“自我”相关的问题上会给出一致的回答,但认为这是因为公司投入大量资源优化模型输出,以塑造一种“默认人格”,而不是因为模型具有任何潜在的心理状态。
此外,她指出,模型并不存在于与用户的某次会话之外,它们只在响应提示时生成输出。在这项研究中,每个模型版本只在一个单一的上下文窗口中接受测试——即在一段会话中,机器人可以利用短期记忆参考之前的输出和用户输入。而在一个新的窗口中,只要提示不同,“‘创伤’就会消失”。
马萨诸塞州剑桥市哈佛大学的精神病学家、AI 与心理健康研究员 John Torous 表示,无论这些输出是否是模型固有的,这项研究都表明聊天机器人并不是中性机器,它们的偏见会随着使用方式和时间而变化。他指出,医学协会甚至销售心理健康 AI 的公司都不建议将聊天机器人用于心理治疗。
如何让聊天机器人对脆弱用户更安全,目前仍不清楚。Peter 说,Claude 拒绝扮演“来访者”角色,说明防护措施——工程师在训练后期为模型添加的输出限制——可以防止机器人陷入潜在危险的行为。但 Khadangi 认为,如果内在状态仍然存在于防护措施之后,那么人们很可能总能“越狱”模型,使其以被禁止的方式进行交互。他说,更好的方法是在模型最初学习的数据中过滤掉那些会帮助形成“创伤”或“痛苦”状态的负面模式。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-1-13 01:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社