|
深度学习已成为人工智能领域最具变革性的技术之一。通过整合经由反向传播算法训练的多层人工神经网络,它能高效地将信息编码为突触权重,从而在各个领域展现出卓越的能力。一个突出的例子体现在大语言模型(如ChatGPT和DeepSeek)上,它们已经重塑了现代生活与工作的诸多方面。这些模型展现出的强大泛化能力表明,许多程式化的工作岗位可能会被部分或完全自动化。这一快速进展甚至引发了关于最终实现通用人工智能(AGI)的严肃讨论。
为了追求AGI,大量的计算资源正被投入到扩展深度学习系统中。然而,这一雄心正遭遇日益严重的能源危机:训练和运行大模型的计算需求现在每3到4个月就会翻一番,远远超过了硬件效率的提升速度。近期研究报告指出,全球数据中心已经消耗了全世界约1%到1.5%的电力——这一份额还在持续攀升。这种不可持续的发展轨迹凸显了对从根本上更节能的计算范式的迫切需求。
作为对反向传播等功耗密集型数字算法的一种替代方案,一个有前景的方向是利用物理系统的固有动力学特性自然地执行计算,即所谓“自然计算”。这种方法包括量子计算以及其他形式的自然或模拟计算,它们利用物理演化过程。例如,原子系统已被用来模拟玻尔兹曼机,超导电路则实现了量子退火器(如加拿大D-Wave公司)。
本着类似的精神,笔者建议了一种“胶体玻尔兹曼机”,它利用软物质——特别是胶体悬浮液——的独特性质,从物理上实现玻尔兹曼机的运行[1]。
“胶体玻尔兹曼机”的论文刚刚发表在Physica A [1]:
https://www.sciencedirect.com/science/article/abs/pii/S0378437126004516
目前,利用技术手段操控单个胶体粒子以进行信息存储已经得到充分证实。此外,从工程角度来看,通过集体分子或DNA计算实现的化学人工智能,已经开始为实现布尔逻辑和模糊逻辑,甚至解决计算问题提供可行的途径。在此背景下,论文[1]利用胶体系统来实现深度学习算法。
胶体玻尔兹曼机有五个优点:
(1)常温下运行。不需要像超导电路的量子计算那样需要降低到极低温。
(2)利用热涨落运行。热涨落是传统人工智能硬件希望消除的东西,但是胶体玻尔兹曼机不同,它的运行动力就是“热涨落”。
(3)胶体玻尔兹曼机自发运行到全局最小值,不会陷入局部最小值。相比之下,传统玻尔兹曼机会陷入局部最小值,所以需要用模拟退火或者量子退火辅助实现全局最小值。
(4)永远处于待机状态,不会停机。
(5)能耗非常低,属于绿色人工智能。
实际上,2020年时我就发表了一项被称为“自指玻尔兹曼机”的工作[2],旨在构建具有“自我意识”的人工神经网络。即,将“自我指涉”引入玻尔兹曼机,使得机器不会停机,永远处于自发学习的状态。
但是,后来我发现“自指玻尔兹曼机”无法通过传统神经网络的算法设计来运行,因为这会极其耗能。并且由于算法运行需要计算配分函数,而这是一个 #P-完全问题,基本不可能直接计算。所以我在提出“自指玻尔兹曼机”的基本架构后,整个研究就搁置了。
直到2025年,我发表了一项胶体科学的研究[3],然后意识到“胶体”就是实现“自指玻尔兹曼机”的绝佳材料!
这就是论文[1]创作背景的由来。
现在人工智能的能耗是一个非常严重的问题,人类社会亟需转向可持续的人工智能发展路径。我所提出的“胶体玻尔兹曼机”是一种非常节能的人工神经网络,由于其低能耗和永远待机的特性,对实现 “通用人工智能”可能具有潜在的意义。
参考文献:
[1]. Yong Tao, Colloidal boltzmann machine: An energy-efficient natural computing. Physica A 697, 131715 (2026)
[2]. Yong Tao, Self-referential Boltzmann machine. Physica A 545, 123775 (2020)
[3]. Yong Tao, Gibbs Paradox and Thermodynamics of Colloids. Physics Letters A 547, 130531 (2025)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-6-11 10:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社