||
“元宇宙(Metaverse)”是专注于社交功能的三维虚拟世界,正极大地吸引着学术界和工业界的关注。元宇宙的崛起,意味着一个现实和虚拟的融合社会正在到来。由于新冠疫情的侵袭,人们被迫在物理空间上保持距离,这在一定程度上弱化了传统社交,从而促进了元宇宙的发展。西湖大学AI团队从人工智能视角出发,规划了元宇宙的实现路径。首先,我们描绘了一幅路线图,如图1所示。遍历沉浸式创建、硬件支持、文本释义、语音处理、连接构建、经济系统和安全保护。其次,在图示的各个阶段,我们讨论了相关技术的发展现状,并深刻地剖析了现阶段的瓶颈挑战。AI视角下构建的路线图彰显了AI在元宇宙核心技术中所发挥的重要作用。
图1 AI视角下的元宇宙路线图
沉浸式创建是通过构建一个三维虚拟世界,为人类提供沉浸式感受的技术。近年来,AI迅猛发展彻底改变了该技术,比如AI能显著提升场景的生成速度,终将实现实时场景渲染。然而,人与数字人互动的沉浸感仍是个挑战,所以通过低成本、低带宽方式捕捉场景的计算成像来提供更高的沉浸感,将是未来的探索方向。
硬件是终端用户设备,如脑机接口、虚拟现实或增强现实(AR)头盔。这些设备已经历多次革命性进化,例如AR头盔,从宏观到微观光学,其设计正向纳米光学层级进军以期显著缩小尺寸。大规模衍射装置的设计是当前硬件发展的主要瓶颈,但AI正攻坚克难,与之相关的神经AI芯片亦蓄势待发。
文本释义是基于交流对话的文本生成与分析。元宇宙对商业记录和社会生活便利的程度,主要取决于AI领域中自然语言处理(NLP)的技术水准。NLP主要应用于私人助手和商业会议,而在融合社会中,如何实现与更为广阔的生活在不同时代背景的虚拟人沟通,定能使得元宇宙的用户体验更上一层楼。
语音处理是为了呈现听觉上的沉浸感。语音是元宇宙中各实体之间的主要交流工具,AI的发展将推动元宇宙中的实体如同在现实世界中一样交流。实现此沉浸感需克服许多挑战,如语音合成、复杂声景生成等,均依赖于先进的信号处理和AI声学技术。
连接构建包括网络连接和社会建立,是实现元宇宙用户社交的技术基础。为传输大量数据,元宇宙网络连接需克服延迟、带宽等障碍,而AI可在流量规划、拥堵控制等方面发挥重要作用。达成连接后,群体人所形成的社会,会发生差序格局等管理层面的问题。对此,AI亦可优化群体管理,将人们匹配到合适的圈子中,且提供社交活动所需的识别技术支持。
经济系统是指通过数字货币来交换虚拟商品的社会运作模式。虚拟经济的指数式增长使得大额资产管理和组织欺诈性交易成为技术挑战。对此,AI生成的NFT(不可伪造代币)与AI辅助资产标记可提高资产管理效率,同时AI也可借助去中心化区块链的基础设施建立全新的算法,以甄别交易的真实性。未来基于AI的虚拟经济系统将更为高效与可靠。
安全保护是指对用户隐私高效而可靠的庇护。大量虚拟设备连接或将折损连接的可靠性,为身份盗窃和间谍活动等有害网络安全的行为提供了可能性。为此,传统安全系统通常要求频繁的用户认证,此类低效费时的操作降低了用户体验。依托AI的生物识别或无缝认证将弥补这一缺陷。
此外,AI对元宇宙中其他同等重要的技术,如机器人、云计算、物联网和决策系统等,也展现出了可圈可点的贡献。例如,强化学习能综合海量数据和多重因素,帮助做出更准确的决策,现已掀起决策分析的新潮。AI不仅推动了上述技术的演变,其本身也发展迅速。展望未来,AI将从“通过AI算法使硬件智能化”逐渐转向“通过AI算法构建智能硬件”。AI中的新技术,如强化学习、联邦学习、小样本学习等,可能会为实现元宇宙带来新的契机。
总结与展望
由AI驱动的新时代呼之欲出。AI将在元宇宙的发展过程中,在各个技术的变革中,起到关键和核心的作用。此路线图粗略地勾勒出AI视角下的元宇宙之路,从AI的角度,详解了7个主要技术及其他技术的研究现状及发展方向。畅想未来,AI可能会给元宇宙带来更多的变革。AI驱动的数字人已经出现,由AI驱动的社会、永生技术、经济系统等,可能也会在元宇宙中出现。元宇宙也将经历更多革新,以满足未来社会发展的需要,而AI必将成为这场变革的先锋旗手。
责任编辑:孙海桐 剑桥大学
本文内容来自Cell Press合作期刊The Innovation第三卷第五期以Commentary发表的“Roadmap towards Metaverse: An AI Perspective” (投稿: 2022-06-09;接收: 2022-07-13;在线刊出: 2022-08-01)。
DOI: https://doi.org/10.1016/j.xinn.2022.100293
引用格式:Cheng S., Zhang Y., Li X., et al. (2022). Roadmap towards Metaverse: An AI Perspective. The Innovation. 3(5),100293.
原文链接:https://www.cell.com/the-innovation/fulltext/S2666-6758(22)00089-3
扫二维码|查看原文
作者简介
成生辉,西湖大学青年研究员,现任智能可视化实验室负责人,曾在德国莱比锡大学医学研究所、美国布鲁克海文国家实验室和美国哈佛大学医学院进行研究,曾任世界银行(总部)数字经济组顾问、大数据高峰论坛(中国可视化专委会举办)执行主席,国际可视化年会、太平洋可视化大会、中国可视化大会等项目委员会委员。主要研究方向为数据可视化、可视分析和元宇宙等。著有《元宇宙:概念、技术及生态》。
袁 鑫,2012年在香港理工大学获得博士学位;2012-2015年在美国杜克大学从事博士后研究;2015年加入美国新泽西贝尔实验室,担任视频分析与编码首席研究员。2021年秋全职加入西湖大学,担任工学院副教授。袁鑫博士致力于计算成像,包含成像系统的研发和基于机器学习的算法研究,是国际上单次曝光压缩成像 (Snapshot Compressive Imaging) 的主要推动者。在国际期刊和顶级会议上发表论文150多篇,申请国际专利20余项(已授权10项),其中多项专利已进行产业孵化。 李子青(Stan Z. Li),西湖大学人工智能讲席教授,IEEE Fellow,IAPR Fellow,曾任职微软亚洲研究院,中科院自动化所。2019年加盟西湖大学工学院,研究方向为人工智能与数据科学及学科交叉。发表论文400余篇,撰写编写著作10部,Google Scholar引用54000余次,其中《Markov Random Field Modeling in Image Analysis》被誉为"图像分析领域里程碑意义的工作“,他引5000余次;受Springer 之邀主编《Handbook of Face Recognition》和《Encyclopedia of Biometrics》。曾任AI顶刊IEEE T-PAMI等刊物副主编,担任100余个国际学术会议大会主席、程序主席或程序委员。
更多相关内容
科学网—[转载]人工智能:科学研究新范式 | The Innovation
科学网—[转载]模数融合的全新训练模式:物理神经网络的构建 | The Innovation
期刊简介
The Innovation是一本由青年科学家与Cell Press于2020年共同创办的综合性英文学术期刊:向科学界展示鼓舞人心的跨学科发现,鼓励研究人员专注于科学的本质和自由探索的初心。作者来自全球47个国家/地区;每期1/4-1/3通讯作者来自海外;已被107个国家/地区作者引用。目前有195位编委会成员,来自21个国家;50%编委来自海外;包含1位诺贝尔奖获得者,33位各国院士;领域覆盖全部自然科学。The Innovation已被DOAJ,ADS,Scopus,PubMed,ESCI,INSPEC等数据库收录。秉承“好文章,多宣传”理念,The Innovation在海内外各平台推广作者文章。
期刊官网1(Owner):
期刊官网2(Publisher):
www.cell.com/the-innovation/home
期刊投稿(Submission):
www.editorialmanager.com/the-innovation
商务合作(Marketing):
marketing@the-innovation.org
扫二维码 | 关注期刊官微
第3卷第3期视频解读-科学网视频-科学网 (sciencenet.cn)
The Innovation 创刊视频-科学网视频-科学网 (sciencenet.cn)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 00:43
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社