||
2023年12月20日,西蒙斯基金会(Simons Foundation)的一份独立编辑的在线出版物——《Quanta Magazine(量子杂志)》,发表了三篇“2023 IN REVIEW(2023年回顾)”的文章,其中一篇由比尔·安德鲁斯(Bill Andrews)撰写,题为《The Year in Computer Science (计算机科学年)》。文章称:计算机科学家们在人工智能的向量驱动方法上取得了进展,从根本上改进了用于分解大数的Shor算法,并研究了大型语言模型可能产生的令人惊讶和强大的行为。
图1 比尔·安德鲁斯文章的题图(参考资料[1])
我们下面在对西蒙斯基金会做极简的介绍后,介绍比尔·安德鲁斯的文章中谈到的2023年计算机科学的最大发现。
[ 大模型 ]
前面提到的比尔·安德鲁斯的《计算机科学年》文章指出,2023年人工智能主导了流行文化——表现在从互联网爆红事件,到参议院听证会的一切事件中。大型语言模型,如ChatGPT背后的那些模型,助力了人工智能热潮,即使研究人员仍在努力撬开描述其内部工作的“黑匣子”。图像生成系统,也以其艺术能力给我们留下深刻印象,并使我们不安,但这些系统显然是建立在从物理学借来的概念上的——扩散模型通过学习逆转引起墨水在水中扩散等过程的方法,生成令人难以置信的图像。
水分子制造波浪,成群的鸟一起俯冲和翱翔,无意识的原子结合成生命。科学家称这些为“涌现行为”,他们最近看到大型语言模型也发生了同样的事情——人工智能程序在巨大的文本集合上训练,产生类似人类的写作。当它们达到一定规模后,这些模型可以突然做一些更小的模型做不到的意想不到的事情,比如解决某些数学问题。
然而,对大型语言模型的兴趣激增,引发了新的担忧。这些程序发明了谎言,制造了社会偏见,甚至无法处理人类语言中一些最基本的元素。此外,这些程序仍然是一个黑箱,它们的内部逻辑是不可知的,尽管一些研究人员知道如何改变这一点。
[ 欣赏人工智能艺术 ]
像DALL E 2这样的图像生成工具今年大受欢迎。只需给他们一个书面提示,他们就会给你一个描绘你所要求的任何东西的艺术画面。但是让这些人造艺术家成为可能的工作已经酝酿了很多年。基于描述扩散流体的物理学概念,这些所谓的扩散模型有效地学习了如何将无形的噪音解读为清晰的图像——就好像将一杯咖啡的时钟倒转,看着均匀分布的奶油重组为轮廓分明的一团。
人工智能工具也成功地提高了现有图像的保真度,尽管我们离电视上警察反复喊“增强”的比喻还很远最近,研究人员转向扩散之外的物理过程,以探索机器生成图像的新方法。泊松方程描述了电力如何随距离变化,这是一种更新的方法,在某些情况下,它已经被证明比扩散模型更有能力处理误差,也更容易训练。
[ 新的向量驱动AI方法 ]
尽管人工智能已经变得非常强大,但支撑大多数现代系统的人工神经网络都有两个缺陷:它们需要大量资源来训练和操作,并且它们很容易成为难以理解的黑匣子。
许多研究人员认为,也许是时候采取另一种方法了。人工智能系统不是使用不使用检测个体特征或特点的人工神经元,而是可以用无穷无尽的超维向量——成千上万个数字的阵列——来表示概念。这个系统更加通用,能够更好地处理错误,使其计算更加高效,并允许研究人员直接处理这些模型考虑的想法和关系,让他们更好地了解模型的推理。
超维度计算仍处于起步阶段,但随着它得到更大的测试,我们可能会看到新的方法开始扎根。
[ 计算机科学的其它进展 ]
这一年带来了计算机科学的许多其他进步。Shor的算法是量子计算的杀手级应用,在近30年后获得了首次重大升级。研究人员最终学会了如何在一个普通的网络中以理论上最快的速度找到最短的路线。密码学家与人工智能建立了意想不到的联系,表明机器学习模型和机器生成的内容也必须应对隐藏的漏洞和消息。
有些问题似乎仍然超出了我们的解决能力——就目前而言。
[ P vs NP ]
研究人员在该领域最古老的问题之一上取得了微妙但重要的进展,这个问题是关于被称为“P vs NP”的难题的本质。
粗略地说,P是一类很容易解决的问题,就像按字母顺序排列列表一样。NP是一类有容易检查的解决方案的问题,像数独谜题。因为所有容易解决的问题也容易检查,所以P中的问题也在NP中。但是有些NP问题似乎很难解决——如果不首先尝试许多可能性,你不可能立即直觉地找到数独谜题的答案。这种明显的困难可能只是一种错觉——有一个简单的技巧可以解决所有容易检查的问题吗?
50年来,计算机科学家一直试图解决他们领域中最大的公开问题,即“P vs NP”它大致上有关某些难题有多难。50年来,他们的尝试都以失败告终。很多时候,当他们开始用一种新的方法取得进展时,他们遇到了障碍,证明这种策略永远不会奏效。最终,他们开始怀疑为什么证明一些问题很难。本·布鲁贝克(Ben Brubaker)探索了这个问题。计算复杂性理论家试图回答的问题:为什么(在精确的、定量的意义上)很难理解是什么让难题变得困难?他们回答这种内向问题的努力已经发展成为一个子领域,称为元复杂性(meta-complexity),它为这个问题提供了迄今为止最深刻的见解。元复杂性是指计算问题和任务的复杂性,这些问题和任务本身与计算及其复杂性有关。
布鲁贝克写道:“这不是一次轻松的旅程——道路上布满了错误的转弯和路障,它一次又一次地回到自己身上。"然而,对于元复杂性研究者来说,探索未知领域的旅程本身就是一种回报."
解决P vs NP可能会解决无数的逻辑问题,让所有的密码学都变得毫无意义,甚至可以说明什么是可知的,什么是我们永远无法理解的。
[ 最短路径算法 ]
最短路径算法是为解决最短路径问题而设计的一系列算法。最短路径问题是大多数人都有一些直觉熟悉的东西:给定两点,A和B,它们之间的最短路径是什么?然而,在计算机科学中,最短路径问题可以采取不同的形式,因此需要不同的算法来解决所有这些问题。
计算机科学家很早就知道可以利用图的算法,图是由边连接的节点网络,其中的连接有一定的成本,就像连接两个城市的收费公路。但是几十年来,当道路既有成本又有回报时,他们找不到任何快速算法来确定最短路径。去年年底,三名研究人员推出了一种可行的算法,其速度几乎达到了理论上可能的速度。
2023年3月,研究人员发布了一种新的算法,可以精确地确定两种类型的数学对象(称为群)何时相同;这项工作可能会产生能够更普遍地快速比较群(或许还有其他物体)的算法,这是一项异常困难的任务。在过去50年里,群同构算法一直没有明显进展。然而,现在一位华人科学家通过提出一种新方法,成功地解决了这个问题,为我们更清晰地了解比较对象所涉及的计算复杂性迈出了一小步。来自芝加哥伊利诺伊大学厄巴纳-香槟分校的这位华人科学家名叫Xiaorui Sun,曾经在加州大学伯克利分校西蒙斯研究所、微软研究院工作过。
[ SHOR算法 ]
1994年,麻省理工学院数学家彼得·肖尔(Peter Shor)提出的“Shor算法”,将使未来的量子计算机能够快速分解大数,他展示了量子计算机在寻找大数的素数因子方面惊人的潜力。这些素数用于互联网是加密信息的密匙。
2023年,来自纽约大学计算机科学家奥德·雷格夫(Oded Regev)首次提出了一种方案,可以大大减少超大型数字因数分解所需的门数或逻辑步骤,它第一次改善了被因式分解的数的大小和因式分解所需的量子操作的数量之间的关系。
这个结果的意义远远超出了数学范畴。原则上,它可以让更小的量子计算机找出加密密钥,或者让更大的机器更快地解码加密密钥。
[ 结语 ]
《The Year in Math数学之年》——拉姆齐(Ramsey)定理的里程碑式成果和非常简单的非周期性瓷砖,为一年的数学乐趣和发现画上了句号。
《The Year in Physics物理学年》——从最小的尺度到最大的尺度,今年的物理世界不乏惊喜。
《The Year in Computer Science (计算机科学年)》——人工智能比以往任何时候都更好地学会了如何生成文本和艺术,而计算机科学家则开发出了解决若干长期未解决问题的算法。
我们前面主要依据参考资料[1],回顾了2023年计算机科学最大发现。有关2023年数学和物理学最大发现,见参考资料[2]~[3]。
参考资料:
[1] Bill Andrews. The Year in Computer Science. Quanta Magazine. December 20, 2023
https://www.quantamagazine.org/the-biggest-discoveries-in-computer-science-in-2023-20231220/
[2] Konstantin Kakaes. The Year in Math. December 22, 2023
https://www.quantamagazine.org/the-biggest-discoveries-in-math-in-2023-20231222/
[3] Nadia Drake.The Year in Physics. December 20, 2023
https://www.quantamagazine.org/the-biggest-discoveries-in-physics-in-2023-20231221/
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 21:07
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社