博文

元梦：水果拼盘的元宇宙精选

已有 7319 次阅读 2021-12-3 11:19 |系统分类:科研笔记

路比丢了

用背带把路比背在胸前，骑单车带他出去逛街。玩得很嗨，突然发现他不见了，不知道在哪里，他从背带上滑下去了。一边自责，一边赶紧沿着来的路找，可是压根没看到他的影子。有点绝望了，都准备打印寻狗启事满街张贴，找到重金酬谢了。

猛然想起它凌晨3：30就来叫过早，赶紧伸手往背后摸了下。还好，它就睡在我的被子上。

人类的元宇宙太可怕，根本分不清真假。

真应了《红楼梦》中的那句话：

“假作真时真亦假，无为有处有还无。”

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

2021年11月20日，中国自动化学会混合智能专委会和中国自动化普及工作委员会联合主办了《混合智能、深度学习及其应用》的论坛。作为论坛的主席之一，我邀请了九位专家。考虑到最近元宇宙比较火，我也尝试着将元宇宙的思想与本次论坛主题进行了结合。因为是线上直播，人气不错，一天下来，B站上累计有2万次的收听量。

其中，第一个由中科院自动化所王飞跃研究员的报告让人印象深刻。他的报告主题是：《回到未来的平行智能：从影子、孪生、镜像、元宇宙到智能科技》。在报告中，他讲述了很多不同于目前媒体上能见到的元宇宙的内容。

比如说到元宇宙的起源，人们普遍认为是源自1992年尼尔·斯蒂芬森的科幻小说《雪崩》，因为在这篇小说里，他构造了元宇宙的概念，metaverse，畅想了一个现实宇宙之外的虚拟宇宙空间，每个人在此空间中都拥有一个虚拟替身Avatar，可以自由定义他的形象，但又不允许比现实中的自己高。

而事实上，讨论虚实世界共存的书之前也不少。比如1981年弗诺·文奇撰写的科幻小说《真名实姓》(True Names)。还有王老师重点提及的, 比《雪崩》早一年，1991年戴维·杰勒恩特（David Gelernter）出版的《镜像世界》（Mirror Worlds）。书中预言了一种软件，它可以用数字模拟来取代现实世罗师傅，从而彻底改变计算、改造社会。只不过这位耶鲁大学的教授比较激进，不太受人爱戴。比如他曾起诉苹果公司要求巨额赔偿，因为苹果电脑中采用的很多概念如Spotlight, Time Machine，他认为是源自他的这本书。苹果公司花了很大的代价和很长的时间，才把这场官司打赢。不过，杰勒恩特提出的、可用于处理多个并行进程之间协调和通信，以及从共享的虚拟关联存储器进行检索的编程语言Linda，倒是很有名气。

王老师也提到与Metaverse对应的一个名词Metaphysics是形而上学的意思。我也顺便到英文词典上，查了下Meta这个词根的意思，它是“beyond or at a higher level”即超越的意思。理解了词根，就不难理解和它组合后的一些词的意思了。比如机器学习中近年来比较流行的元学习，英文是Meta Learning。它的意思是超越学习。因为以前我们研究机器学习，都是把数据看成样本，通过模型来学习数据集里的规律，以形成对未知数据的预测能力。而要超越这种学习，就需要将学习看成样本，通过模型学习，学习方法中的规律，以形成对未知的或新的学习方法的预测能力，所以叫元学习。而Metaphysics形而上学则是希望beyond ordinal physical things，即超越寻常的物理世界，自然就是要偏唯心了。那么，Metaverse是meta和universe的组合，意思就是要超越现有的宇宙。

这也是为什么脸书的扎尔伯格把公司名字改成Meta的原因，因为他希望获得在互联网上的超越。确实，从互联网的发展进程来看，web1.0是纯粹的网络单向向人输出信息的时代，web2.0是人参与网络中，有了些许互动的时代。那么，再往后看，人可以嵌套在网络中，网络也嵌在生活中，虚实互动，才有可能形成web3.0这样的进阶版。

那么，元宇宙怎样形成一个更高层次、超越的宇宙呢？元宇宙的设计者们给出了一个初步的答案，即有六大支撑技术，称为BIGANT。B是区块链Blockchain，I是interactive交互，G是Game游戏，A是Artificial Intelligence人工智能，N是Network computing网络计算，包含云计算和边缘计算，T是Networks of Things，即物联网。

可是，理想归理想，现实归现实。在现阶段，这样架构起来的元宇宙到底是否成熟可行呢？依我看来，虽然每项技术在现阶段都有其值得称赞的地方，但整合起来看，它更像是一个水果拼盘。好处是，如同水果拼盘一样，可以卖个更好的价钱，而且便宜的也能顺便搭车。然而，水果拼盘毕竟是成熟的水果，每个品种都还是能吃的。那元宇宙里的水果呢？可能还不太熟，容我一个一个分析下。

首先是B区块链。它最核心的概念是去中心化，也被认为是能保护隐私的金融交易利器，而其中的比特币更是众多虚拟币中最热的一种。但正是因为它能保护隐私，所以，它也成为很多黑客勒索钱财的新型手段。而去中心化这块，一个尴尬的事实是，特斯拉总裁马斯克曾经一段停止用比特币购买汽车的推特就将比特币的价格直接拉低。以至于，大家都不得不思考下，马斯克是如何在去中心化的世界里实行中心化控制的。而目前关于区块链的赢利模式，也并不是特别的明晰。有朋友说是“类似于Nasdaq的科技泡沫股体现在token价格上，以及精心设计的庞氏金融/游戏上。”也有开玩笑的说法是“区块链目前的赢利模式主要体现在区块链的讲座”上。但不管如何，这块目前还不熟。

那么，交互呢？可能对大众来说，最有印象的应该是2018年史蒂文·斯皮尔伯格拍的电影《头号玩家》。电影里面，人们要进入虚拟世界的话，需要借助一个头戴式的虚拟现实设备。但实际上，我们目前至少有三种可行的交互方式，增强现实(Augment Reality, 简称AR），虚拟现实（Virtual Reality, 简称VR）和混合现实（Mixture Reality, 简称MR）。增强现实如曾昙花一现的Google眼镜，可以在看到的景象上叠加相关的辅助信息如餐厅的特点、价格；景点的地址、开放时间等。遗憾的是，这种穿戴式的增强现实终究避不开电池不能持久的问题。而沉浸式的虚拟现实VR技术，则能让观众身临其境地感受各种场景，提供用户在听觉、视觉甚至触觉，也许未来还能有味觉上的模拟，有十足的沉浸感和临场感。但在现阶段，似乎头戴式的VR显示屏形成的眩晕感以及其他问题，往往让人不太习惯长期佩戴这一设备。比如我自己就有一个高清的头戴式显式屏，虽然不做VR没有眩晕感，但我依然极少拿它看电影，因为看个片子要戴一个多小时，还是多少有点辛苦的。而混合现实相对更难，因为要将虚拟物体置于真实世界，并让用户可以与虚拟物体进行互动。这里面还有不少技术问题需要解决，如虚拟物体在真实世界的遮挡问题。不过交互这一块还是有些成果的，至少我们现在能在很多商场看到一些基于交互的游戏了。但要变成元宇宙的核心模块，可能还需要继续努力。

而G电子游戏这块。今年有件值得讲的大事，就是2021年11月6日的英雄联盟全球总决赛中，我国的EDG电子竞技俱乐部获得了冠军。爱屋及乌，以至于总决赛的主题曲《不可阻挡》也跟着流行起来。但关于是否应该支持游戏业的发展，尤其是对于还在学习阶段的学生来说，我想答案必然不是全盘肯定的。除了像 EDG 这样专业从事电竞的另当别论外，反对的呼声一直都很大。所以，元宇宙中如果以电子游戏为支撑，是否能得到家长们的广泛认同，这会是一个问号。

再说说T物联网和N网络及运算技术。物联网本质上是期望通过射频识别（RFID）、红外感应器、全球定位信息、激光扫描器等传感设备，将任何物品与互联网联系起来，并进行信息交换和通讯，来实现智能化识别、定位、跟踪、监控和按理的网络。在此概念上，还有车联网的推广说法。

这个概念提出比较早，我国早在2010年3月教育部就号召211高校申报物联网的学科方向，目前在不少高校都有相关的专业设置，一般隶属在计算机学院下，也有单独成立学院的。但从近十年的发展来看，这一块的就业明显不如学人工智能方向的，物联网本身的工程实现其实也需要人工智能的技术支持。放在元宇宙框架下，有点新瓶装旧酒的感觉。而N的话，包含两大块，一个是云计算和边缘计算。现在看起来，边缘计算确实比较边缘，不在主流上。而云计算相对好一些，当然它也需要很多软硬件的强有力支持，如何在元宇宙做好隐私保护和防止攻击也是值得关注的。另一块则是通讯，如果按现有的元宇宙架构，我们需要更高效的通讯，可能至少6G以上。但目前在国内外的通讯如5G，在基站覆盖上都还不尽如人意，更不用说被国外封堵的6G了。

元宇宙中最后一个核心技术是人工智能。人工智能近十年的快速发展，可能是今年来为啥能提元宇宙的主要原因了，毕竟是其中的核心支撑技术。自2012年以来，人工智能进入了第三次热潮，关键推动力源于深度学习的突破性进展，通过大数据对深度学习的充分训练，以及GPU的高效计算，将各种应用的预测性能实现了显著的提升。以至于在这个行业产生了井喷式的效应，尤其是相关顶级会议的投稿和发表数量上，格外明显。比如刚出来的人工智能顶会AAAI2022上，投稿9000余篇，即使是官方报道的15%这样创新低的接收率，也有1500余篇论文被接收了，正常人很难把全篇论文逐篇看全，更何况人工智能有至少十个以上的顶会。

深度学习的设计技巧很多，比如能加快训练收敛的残差模式、能像人一样关注重要目标的注意力模块或复杂目标情况下的自注意力模块、有多尺度的特征表示方式、有考虑时空关系的模块、有基于图结构的图神经网络。在设计理念上，既有追求大而全的GPT-3, Transformer等模型，也有追求小而精的蒸馏学习，还有追求稳而久的持续学习、终身学习等。但归结起来，其实不外乎三件事的组合：模仿人的结构构造深度网络，发现隐变量寻找真实的原因，以及把病态问题良态化。另外，值得提醒的是，目前的人工智能重心主要是在提升学习任务的预测精度上，还有很多智能相关的问题没有得到圆满解决。比如图灵测试，提了快近七十年了，至今没有能真正通过的。比如80年代提出的莫拉维克悖论，其中提及的，人类觉得简单的，机器会觉得困难的问题。很多也没有找到有效的程序化或形成可计算模型的办法。所以，人工智能到底能对元宇宙产生多大的推动，还有赖于人工智能本身在预测以外有更长足的发展。

除了我谈到的这些问题外，对元宇宙的看法也一直有其他的反面思考，比如这六大技术背后体现的隐忧，如扰乱金融秩序、非法收集数据、经营非法出版物、非法收集数据、无证从事云计算、高能耗等。虽然是玩笑话，但也值得人深思。

依我看，更理想的元宇宙，应该是建立在人的梦的基础上的。因为它不用追求多高分辨率的虚拟环境，但却有着更强的身临其境的沉浸感。我们也不用太多的传感器来构建物联网，只需要有一个能相互串梦、能进行远距离梦境传输的脑机传感器，就能帮助实现灵魂社交。而且，梦里的金融和梦币交易更容易实现去中心化。因为在梦里，是无论贫困富有、健康或疾苦，人人平等的，不会出现“马斯克的一言堂”的矛盾。如果再辅之以人工智能帮助提升梦元宇宙的愉跃感、沉浸感等，如此这般，我们才有可能把梦的元宇宙做实了。

如果要给这个梦的元宇宙取个名字，我觉得可以叫元梦（圆梦），Metadream！

张军平

2021年12月3日星期五

耗时一上午写完

注：部分图来自网络

人工智能的尽头是人工？

6. 元梦：水果拼盘的元宇宙

张军平，复旦大学计算机科学技术学院，教授、博士生导师，中国自动化学会普及工作委员会主任，混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。至今发表论文100余篇，其中IEEE Transactions系列27篇，包括IEEE TPAMI, TNNLS, ToC, TITS, TAC, TIP等。学术谷歌引用5100余次，H指数33. 出版科普著作《爱犯错的智能体》，该书获得2020年中国科普创作领域最高奖，即2020年中国科普作家协会第六届优秀作品奖金奖。

转载本文请联系原作者获取授权，同时请注明本文来自张军平科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3389532-1314979.html

上一篇：强化学习的示教与自驱
下一篇：元梦园，元宇宙的未来

收藏 IP: 202.120.235.*| 热度|

heruspex的个人博客分享 http://blog.sciencenet.cn/u/heruspex

博文

元梦：水果拼盘的元宇宙精选

当前推荐数：7 推荐人：章忠志 周忠浩 黄永义 吕卓生 苏德辰 褚海亮 许培扬

该博文允许注册用户评论请点击登录评论 (5 个评论)

张军平

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

heruspex的个人博客分享 http://blog.sciencenet.cn/u/heruspex

博文

元梦：水果拼盘的元宇宙 精选

当前推荐数：7 推荐人： 章忠志 周忠浩 黄永义 吕卓生 苏德辰 褚海亮 许培扬

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

张军平

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

元梦：水果拼盘的元宇宙精选

当前推荐数：7 推荐人：章忠志周忠浩黄永义吕卓生苏德辰褚海亮许培扬

该博文允许注册用户评论请点击登录评论 (5 个评论)