YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

第三届世界人工意识大会——James J. Heckman 主题演讲

已有 126 次阅读 2026-3-30 10:06 |系统分类:论文交流

第三届世界人工意识大会——James J. Heckman 主题演讲

 

2000年诺贝尔经济学奖得主、美国经济学家James J. Heckman院士

非常感谢今天给我这个发言机会。我是经济学家,并不是直接从事人工智能研究的学者,但我一直在使用 AI、研究它的影响,并且我相信,AI 能够以非常重要的方式促进科学中的因果研究。

今天我想讨论三个相互关联的主题。第一,在经济学以及更广泛的科学研究中,我们究竟如何理解因果性。第二,为什么因果分析不能被简单归结为传统统计学问题,尽管它常常被如此对待。第三,AI 和机器学习如何帮助我们开展因果研究,尤其是在构建、比较和解释动态结构模型时所发挥的作用。

我还会简要谈到 AI 与机器人在研究中的应用,特别是在涉及人类发展和互动的项目中。我的核心观点很简单:如果我们想真正理解世界、改善世界,光有预测还不够,我们还需要解释、机制以及清晰的因果结构。

好的科学研究,核心在于理解产生结果的机制。无论是医学、物理学,还是经济学,科学研究的目标都不仅仅是发现某个变量与另一个变量同时变动,而是要弄清楚:结果是如何产生的,不同输入因素分别发挥了什么作用,以及什么样的干预能够改变事情的发展方向。

从这个意义上说,好的科学本质上就是因果分析。它追问:究竟是什么因素产生了结果,这些因素通过什么渠道起作用,以及在什么条件下干预会成功或失败。如果我们真的想以有益的方式改变世界,就必须超越表层相关性,去描述支配行为和结果的深层机制。

我想强调的一点是:因果性并不仅仅是一个传统统计学问题。统计方法当然有用,而且在许多场景下不可或缺,但因果推理所需要的,远不只是把方程拟合到观测数据上。它要求我们去思考假设世界、替代性可能以及那些也许从未直接出现在数据中的干预后果。

这意味着,因果研究首先要从一个概念框架出发。我们要先提出关于世界如何运作的抽象模型,然后再用证据去检验这些模型。数据固然重要,但数据本身并不会自动定义因果关系。因果性是一种理解数据的方式,而不是某种天然隐藏在数据之中、等待被自动提取出来的属性。

因果分析的核心,在于对反事实世界的探索。我们会问:如果只改变一个因素,而把其他条件保持不变,会发生什么?如果采用不同的处理方式、做出不同的选择,或处在不同的环境中,结果会怎样?这类问题本质上是思想实验,但它们并不是随意的想象,而是有纪律的思想实验,是严肃因果推理的基础。

这种观点不同于那种狭义理解,即认为因果分析无非就是现场实验或随机试验。我并不是否定这些方法,它们当然很重要。但它们只是更大框架中的一部分。真正完整的因果分析,需要构建可信的假设模型,并将其与现实世界数据进行检验。模型与数据必须相互接触,但我们也必须明确区分:一方面是构思机制,另一方面是利用观测数据去识别和估计该机制。

机器学习能够极大促进因果分析中的一个重要环节:寻找最可信的解释。从哲学上讲,这与溯因推理有关,也就是在多种候选解释中识别出最可能的那一个。在现实科学研究中,同一现象往往可能有多种解释。AI 可以帮助我们组织信息、比较模式,并缩小可能机制的范围。

这一点尤其重要,因为现代 AI 使我们能够整合许多过去很难统一使用的信息来源:文本、报纸、网络帖子、语境记录,以及各种非结构化信息,并把它们与常规数值数据结合起来。从这个意义上说,AI 扩展了科学研究可利用的信息基础,使我们能够比过去更有力、更系统地汇聚证据。

但与此同时,AI 并不能替代科学判断。因果假设的提出仍然需要思考、解释和长期积累的知识。AI 是增强研究能力的工具,而不是取代严谨推理的替代品。

当代很多讨论把好的科学简化为对某个结果变量的处理效应进行估计,这种理解太狭窄了。科学模型和理论的作用,并不仅仅是估计一个平均效应。它们还帮助我们总结既有知识、整合前人研究、解释当前证据,并把新发现放到更广阔的知识体系中去理解。

这种更宽广的视角,对于个性化教育和个性化医疗尤其重要。不同个体对同一种干预的反应并不相同。要理解这种差异,我们必须有结构化框架,必须有能够描述异质性、决策过程、约束条件以及信息随时间演化的模型。AI 可以帮助我们处理这种数据丰富环境中的复杂性,但科学的真正目标仍然是因果理解,而不是单纯预测。

动态视角之所以重要,是因为人们总是在信息不完全的情况下作出决策。在选择发生的那个时点,决策者通常并不知道未来会显现出什么信息。事前与事后的区别在这里至关重要。一个事后看来似乎愚蠢的决定,在事前可能完全是合理的,因为当时可获得的信息就是那样。

因此,因果分析必须把信息、预期以及决策时点纳入考虑。它也必须考虑自愿参与和自我选择。人并不是被动接受处理的对象;他们往往会基于预期收益、预期成本以及对未来的判断,主动进入某种环境、项目或关系之中。

我们之所以需要更丰富的因果框架,还有一个重要原因:很多关键结果都是通过社会互动产生的。疾病通过互动传播;能力通过家庭、学校和同伴群体不断积累;社会规范则在影响网络中生成、延续或消失。许多标准的因果框架并不足以充分刻画这些互动效应。

同时,我们还必须区分内部效度和更广意义上的适用性。内部效度关注的是:在特定情境中,我们是否真正识别出了正确机制。这当然重要。但更大的科学挑战在于:我们是否足够理解这一机制,以至于能够推理到其他场景、其他人群和其他干预条件。一个因果模型应当帮助我们超越单一数据集所对应的狭窄环境。

我认为,把问题区分为三个任务会非常有帮助。第一是模型创建:构建一个连贯的概念框架,并生成反事实世界。这不仅仅是统计操作,它需要想象力、纪律、先验知识以及科学判断。

第二个任务是识别:即追问,在理想数据条件下,模型所描述的机制是否原则上能够被区分、被恢复出来。第三个任务是估计:利用现实世界中带有测量误差和各种限制的数据,去估计参数并检验模型含义。AI 和机器学习在识别与估计方面,尤其是在高维环境下,能够发挥非常强的作用;但我们必须把它们理解为更大科学架构中的组成部分。

随机对照试验之所以有价值,是因为随机分配能够打破某些依赖关系,从而使某些因果比较更加清晰。但随机化并不是进行因果分析的唯一方式,也并不总是每一个问题上的最佳方式。根据具体情境,我们还可以借助测量系统、潜变量模型、因子模型、工具变量、观察性结构以及动态信息来学习因果关系。

真正的问题在于,不能把任何单一方法抬高为普遍适用的金标准。方法只是工具,它的价值取决于所研究的问题、所关注的机制以及手头可获得的证据。健全的因果推理需要的是方法上的灵活性,而不是教条主义。

最后,我想用一个关于亲子互动研究的例子来收束今天的讨论。这个领域本质上就是动态的、交互性的。传统教育评估往往依赖纸笔测试或低频评估,但新技术已经使我们能够观察到更多内容。我们可以在房间里布设传感器,采集多模态数据,并实时研究互动过程。

在深圳以及其他地方正在开展的一些研究中,配备大语言模型的机器人可以与儿童互动,同时生成关于儿童行为的连续记录。这样的系统不仅使我们能够观察儿童与机器人之间的互动,也能帮助我们更好地理解父母、教师以及周边环境所构成的更大互动系统。我们现在仍然没有完全理解这些互动究竟如何起作用,而这恰恰说明我们需要动态模型。AI 为我们提供了强有力的新型测量与交互工具,但真正的解释仍然需要因果结构。

AI 在科学中的未来,不应仅仅被理解为更好的预测。它更深层的潜力,在于帮助我们组织信息、构建可信机制,并以更丰富、更精确的方式研究动态因果系统。但科学进步最终仍然依赖于清晰的概念、可信的模型,以及对什么导致什么的严谨推理。

如果我们希望真正改善教育、医疗、社会政策以及人的发展,就必须建立一种能够把数据与理论、证据与机制、计算与判断结合起来的框架。在我看来,这才是通向更严肃、也更有用的因果科学之路。非常感谢大家。



https://blog.sciencenet.cn/blog-3429562-1527978.html

上一篇:世界人工意识科学院为诺贝尔经济学奖得主 James J. Heckman 与 中国工程院外籍院士Seeram Ramak
下一篇:跨标准“Purpose/Intent”条款速览
收藏 IP: 140.240.43.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-1 13:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部