||
深度学习的成功、局限与未来发展
当前深度学习(Deep Learning)成功或许得益于机器(计算机)对数据的处理方式。数据是对物理世界中观测对象物理属性或内部机理的多维度碎片化的映射形式,而通过各类传感器可以逐步获得足量的观测数据。进而,人类一直试图从巨量积累的原始数据中蒸馏出知识,特别是依赖机器(计算机)自动实现知识的获取与应用,从而获得各种依赖机器完成的智能性应用,如人脸自动识别等。
那种试图硬编程的方式,并没有获得突破性进展。而试图将人类积累的经验和知识装入巨型机器,使其成为专家的尝试,在机器的知识提取、载入、使用等,特别是能够适应机器的自动知识提取与知识应用方面,鲜有发现令人满意的路径。尽管当前Transformer巨型发展,似乎让人类看到一点未来通用人工智能的曙光,但目前仍然令人存疑:那就是量变必然促向质变。此外,怎么保证设计的机制,能够保证数据到知识的单向映射转换中,在设计的架构中得以实现所谓机器知识与知识的交互,从而产生或自动产生,更高层次的所谓机器知识或物理对象映射所包含的规律,进而实现更加智能的应用呢?
的确,deep learning通过深度神经网络的架构,可以实现简单物理对象的映射数据的特征提取。而物理对象的特征以巨量网络参数的形式存储与使用,从而通过由这些参数组成的对物理世界的模型,制造出了目前的智能机器或种种专用工具,实现诸如智能的人脸识别、智能的搜索与问答等广泛应用。
而问题是,这些由机器自动识别出来的模型,是不是知识?或者是机器知识?
我们目前实现了从数据中,由机器通过DNN识别出实现具体应用的模型,也许算是由原始数据产生的感知驱动的智能应用,而这些模型还不能算是知识。因而,如何由机器从数据,自动学习到更高层次的机器知识,应该比具体的模型层次更高(包括多模型)。但是,如何让机器学习到知识,实现知识驱动的智能?
一个问题是,当前深度学习会不会直接促进知识驱动的实现?如果是,How?而如果不是,又该怎样?
而问题依然在:在寻找让机器自动学习到机器知识,从而进一步应用自己学习到的机器知识方面,仍然充满困难。
未来的发展,也许依然是,如何解决一个老问题:设计让机器能够从数据中自动学习到知识表示、知识存储、知识更新、知识应用的新的架构机制。而深度学习的成功,也许可以作为一个个子集,或者模块存在于未来的架构中,但或许难以单一胜任知识驱动的重担,尽管这个起源于上个世纪的探索与研究----深度学习目前已经很好地实现了从物理世界多维碎片化巨量数据中,获取实现感知驱动的重任。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-7 06:51
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社