博文

享受做科研的快乐——专访中国科学院院士陆汝钤

已有 6184 次阅读 2017-1-12 15:07 |系统分类:论文交流

移动互联网、大数据的普及和应用，对人工智能的需求变得越来越迫切，也给人工智能的研究提供了更加广阔的舞台，作为人工智能领域重要研究方向的知识工程也迎来了大好的发展时机。

　　作为我国人工智能领域研究的开拓者之一，陆汝钤院士在知识工程和基于知识的软件工程方面做了系统的、创造性的工作。如今，81岁高龄的陆院士，矢志不渝、桑榆未晚，仍然坚持在科研、教学的第一线，还亲自加入到大数据知识工程项目研究团队，践行着对自己的期望：潜心科研，脚踏实地去多做事情。

　　计算智能一枝独秀

　　本刊记者：作为中国人工智能领域研究的开拓者之一，请您首先给读者科普一下人工智能知识？您对我国当前比较火热的人工智能产业怎样看待？

　　陆汝钤：智能在不同的生物物种上都有体现，而在人类身上达到极致，是人类最主要特征之一。人工智能研究的一个主要目的是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。然而，什么是人类智能，科学界至今还没有给出令人满意的定义。既然人类智能无法被精确定义，对什么是人工智能这一关键问题也就很难回答。

　　从人工智能发展的几个阶段以及人们对问题的讨论来看，我归纳出智能的三个层次：其中最普遍的一种看法是，凡是需要计算机来模拟人的大脑思维去做事情就是智能。比如计算机做计算、做文字的解读、做推理、写文章、作曲、绘画等都属于这个范畴。计算机科学元老图灵在1950年提出的著名“图灵测试”——让一个人类裁判和处于另一个房间的另一个人(A)加一台计算机(B)通过网络书面谈话。每一场谈话算是一次测试。如果在大量测试中，有相当比例的“中等智力”裁判无法通过书面谈话区分A和B中谁是人，谁是计算机，则称该计算机通过了图灵测试。研究如何使计算机具有智能相当于研究如何使计算机通过图灵测试。它是关于智能标准的一个明确定义。

　　窄一点来说，也可以认为计算机能进行创造性思维才是智能的。计算机做一些固定的、有规律的计算任务，并不需要“聪明才智”，不算是智能。只有在不确定的条件下，计算机还能适当运用并能去解决问题的，才是智能。

　　广一点来说，凡是需要涉及到用人脑（不一定是大脑）去完成的任务，也都可以算是体现了智能。美国的仿生机器人“大狗”能够在复杂地形上负重快跑，其身体平衡能力的掌控就模拟了人类小脑的功能。上述的这三种对智能的定义，大多数情况下人们更多地认可第一种理解。

　　人工智能是一门研究人类智能的机理以及如何用机器模拟人的智能的学科，是人编程、造机器来仿照人的智能行为。若问什么方是发展人工智能的最有效途径，专家们大致有三种不同的观点。

　　第一种，符号主义。是一种基于逻辑推理的智能模拟方法。这方面的代表人物有纽维尔和西蒙，他们提出了著名的“物理符号系统假设”，认为世界上存在着一种物理符号系统，只要充分发现和建设好这个系统，一切的智能系统就能用这个系统来描述和模拟。

　　第二种，行为主义。认为人工智能源于控制论，只要求计算机能够控制机器或物体去模拟人所要求的行为，而不需要太注重它的大脑意识是如何操作的，这就是行为主义。行为主义方面的代表人物首推布鲁克斯，他的“无表示智能”工作在第12届国际人工智能联合大会上获得“计算机与思维奖”。在此基础上设计的六足行走机器人，被看作是新一代的“控制论动物”，是一个基于“感知—动作模式”模拟昆虫行为的控制系统。

　　第三种，计算智能。认为无论什么事情都能通过计算来解决和达到。如果智能没达到，可能是计算理念没达到或计算速度没达到。计算智能的基础包含仿生学。它把世界上各种生物的智能行为，总结成神经智能、蚁群智能、鸟群智能等仿生模型，通过大量的计算来实现。霍普菲尔德和欣顿也许可以算是计算智能的代表人物，是他们带来了上世纪80年代初神经网络学派的强势回归。

　　人工智能最初是专注计算机实现一定的算法来进行问题求解。传统的人工智能强调研究人类思维的普遍规律，研究通用的推理算法，强调解决问题的策略。斯坦福大学的费根鲍姆教授发现这样的思路具有很大的局限性，它不能解决现实世界中许多复杂的问题。仅凭规则而没有丰富的知识是无法达到人们所预期的美好愿景。

　　上世纪六十年代末至七十年代初，费根鲍姆开始研究以专家知识为核心的专家系统技术。1977年他在第五届国际人工智能联合大会上正式提出了知识工程的概念。此概念很快被人工智能界接受。一批批实用专家系统的问世，产生了较大的经济效益和社会影响。1994年费根鲍姆因此获得图灵奖，世界性的成功使得知识工程似乎成了实现人工智能的第四条途径。

　　进入新世纪，特别是大数据时代以后，人们对如何实现人工智能也有了新的认识。在前面提到的人们认为可以实现人工智能的多条可能途径中，计算智能展现出越来越大的潜力。随着高性能计算机的出现、各种各样高科技软环境，尤其是深度学习的崛起，加上各种智能化技术越来越多地依靠计算，使得计算智能在人工智能的众多技术中显现出一枝独秀的趋势。

　　以知识工程为代表的、基于知识的智能化研究正在逐步和计算智能合流。正如吴信东教授指出的，知识获取的来源已经从知识工程初期的主要从专家获得，逐步转变为主要向大数据挖掘索取，基于海量计算的从大数据里提炼知识成为知识获取的重要途径，这是人工智能的一个重要发展方向。以上这些是我对现代人工智能发展的理解和看法。

　　潜心知识工程的研究和开拓

　　本刊记者：知识工程是人工智能的原理和方法，它强调以人类知识作为机器智能的基础，研究知识的表示、获取、转换、推理和应用，被视作推动技术进步的关键手段。为了解决知识工程中的瓶颈问题，您做了哪些基础研究和开拓性的工作？

　　陆汝钤：我是1980年从国外教授做的报告中第一次听到这个名词的。

　　我们在知识工程这个领域主要做了三件事情。

　　第一件事情是1983年后期～1990年初，主要是关注于知识工程的工具、技术和开发环境。首先设计并主持研制了知识工程语言TUILI。TUILI是一个基于谓词逻辑的人工智能语言，具有自然的说明性知识表示方式，能够运用这种说明性知识进行多种组合式推理。它将说明性的产生式语言风格和过程性的逻辑程序设计语言风格结合起来，可以动态调用深度优先、广度优先和最佳优先策略，实行混合的向前和向后推理，在知识程序的模块化结构、元级推理以及计算功能等方面引进了新的控制结构。根据我们当时掌握的资料，知识表示语言的这种设计理念乃我们首创。TUILI曾被一些气象台采用，在当时的反常气象预报中有了很好的应用。其次，我们做了集成多种技术和工具的大型专家系统开发环境《天马》。天马系统是国家七五攻关课题项目，也是当时国内最大的专家系统开发工具包，其规模与文献中报道的当时国际上最大型专家系统开发工具相当。已经推广应用在国防和经济的20多个领域、50多家单位，取得重要的经济和社会效益，荣获1992年中科院科技进步一等奖，1993年国家科技进步二等奖。

　　1990年代，我们做的第二件事情，就是知识的自动获取和知识系统的自动开发。那时对知识工程的理解，专家们普遍认为知识工程的瓶颈问题和最主要难点就是知识获取——从专家那里获取知识。专家知识的来源主要有两种：专家本人口授和专家提供的文献资料，这两种来源都需要通过自然语言的理解这个关卡。众所周知，完全的自然语言理解太困难了，目前还做不到。于是我们研究并设计了基于类自然语言理解的一套知识自动获取技术。类自然语言是一种适度规范化的自然语言。给定一篇文章，类自然语言的语义体现在它的关键字和关键字结构中，关键字以外的文字的语义则可以从关键字结构的语义推出。例如在句子“血球分为红血球和白血球两类”中，“A分为B和C两类”就是关键字结构。计算机从中可以知道A、B、C是三类对象，其中B和C是A的子类，除此之外并不需要明白A、B、C是什么。这就是类自然语言理解的本质。利用类自然语言技术，计算机能够很快把一本专业书籍变成一个结构化的知识库，并进而自动生成一个基于知识的应用系统，即通常所说的智能化计算机辅助XX系统，例如ICAI系统（智能化计算机辅助教学系统）。这个方法有利于把ICAI生成技术从手工编制（第一代），用写作软件编制（第二代）向基于知识自动获取的快速生成（第三代）推进。我们曾用这项技术做过一个ICAI系统的自动开发平台“天蜂”。我们还把这项技术应用于基于知识的应用软件自动生成，特别是MIS系统（管理信息系统）的自动生成。

　　进入21世纪，人类对智能科学的摸索逐渐深入。我们又做了第三件事情，就是提出了“知件”概念。在承担国家攻关任务项目中，我们发现了问题：开发应用软件时，软件里面会含有许多领域知识和应用架构，需要软件工程师和开发人员向领域专家学习不同领域的知识并掌握需求，这个过程是很困难的；再加上开发出来的程序代码和相关的领域知识混合在一起，很难区分开，不利于开发，不利于维护，也不利于在开发新的应用时重复使用程序代码和领域知识。

　　于是2005年，我们提出“知件”的概念。通过“知件”的形式，可以把软件中的知识含量分离出来，把“知件”作为独立的、计算机可操作的、商品化的、可被软件调用的知识模块。我们研究了“知件”的结构，语义和生命周期模型。提出了一种新的中间件—知识中间件，作为知件和软件协同操作的平台。总的来说，我们主张领域知识应该独立于硬件、软件之外，使硬件、软件和知件在IT产业中三足鼎立。我们的知件研究成果得到一些国内外专家的认同和跟进，产生了一系列后续工作。北京大学高可信软件教育部重点实验室把知件作为重点研究方向之一。其中金芝教授领导的团队先后和浙江大学、东北大学合作，研究知件的实现技术及其推广应用，取得一系列成果并获教育部科技进步一等奖。

　　从今年开始我们做了知识工程的第四件事情，就是大数据知识工程。国家重点研发计划“云计算与大数据”重点专项——大数据知识工程基础理论及其应用研究启动，项目首席科学家、合肥工业大学研究团队学科带头人吴信东教授邀请我们参加。我支持吴教授关于从大数据获取大知识的思想，重点研究了大知识的内涵界定，并且提出了大知识工程的主张，有关研究正在进行中。

　　本刊记者：据了解，您曾研究并主持实现了一套全过程计算机辅助动画生成技术，在艺术创造领域内推进了人工智能。能不能具体就这方面谈谈。

　　陆汝钤：计算机辅助动画生成技术是从1990年开始做的，那个时候我特别喜欢看动画片，这带给我两个很深的感受。一是国内的动画片市场基本上都被国外动画片占领，二是动画片开发周期长，费用高昂。我发现利用计算机技术可以推进动画片生产的自动化，人工智能在其中就大有可为。这是人工智能技术的重要试金石。我设计并主持实现了一套全过程计算机辅助动画自动生成技术，其特点是从受限自然语言理解开始，把中文童话故事自动转换成动画片，使计算机模拟脚本改编、电影导演和摄影师的功能。

　　从1990年到1995年，我们基本上走通了这条技术路线，开发出动画自动生成软件《天鹅》。该软件接受以受限中文自然语言形式输入的儿童故事，首先是自然语言理解，其次是故事情节的理解和分析，涉及到故事的主角、配角、线索、主题思想等，都要进行分析。再就是各种各样的规划，包括情节规划、角色规划、场景规划等，再加上导演规划，布局规划、摄影规划等，每一层规划都产生新的故事表示，最后转换成汇编格式的脚本语言程序，由商用渲染软件生成可放映的动画片。到1995年，就有了第一个自动生成的动画片——《三兄弟》，曾在中央电视台少儿节目《大风车》中播出。刚开始时技术比较简单，人物也是木偶型，没有表情，到后来《后羿射日》就有配音和表情，技术有了很大的改进。

　　2000年，我们跟北京工业大学合作，建立了动画实验室，张松懋研究员主持做了两项研究。一个是将全过程计算机辅助动画自动生成技术应用于中国古建筑领域，利用动画形式把古代建筑的施工过程再现出来。经过艰苦的学习，学生们硬是把宋代官方建筑的规范《营造法式》改编成知识库，已经完成的《天燕》系统可以自动生成180种不同的古建搭建过程动画。另一个就是做手机动画自动生成，把它作为手机应用软件，可以自动理解短信内容并生成相应的短动画，和短信一起发送。其实我认为动画自动生成技术有着很大的应用潜力，像电子游戏，虚拟现实，慕课教学等都是应用动画自动生成的好方向，甚至于充满符号，非常难懂的体检报告也不妨以动画的形式来解释其内容。当然，动画自动生成想要真正成为成熟商业模式，还需要努力研究，还需要人力、财力的投入。

　　创新来自漫长的积淀

　　本刊记者：在推进人工智能的研究和应用过程中，我国目前发展状况如何？与世界先进国家存在的差距有多大……

转载本文请联系原作者获取授权，同时请注明本文来自《高科技与产业化》杂志科学网博客。
链接地址：https://blog.sciencenet.cn/blog-594908-1027131.html

上一篇：传感产业的“三链融合”
下一篇：抢占第三代半导体战略制高点——访中国工程院院士屠海令

收藏 IP: 159.226.100.*| 热度|

当前推荐数：1 推荐人：强涛

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

《高科技与产业化》杂志

扫一扫，分享此博文

高科技与产业化杂志分享 http://blog.sciencenet.cn/u/hitech http://www.hitech.ac.cn

博文

享受做科研的快乐——专访中国科学院院士陆汝钤

当前推荐数：1 推荐人：强涛

该博文允许注册用户评论请点击登录评论 (0 个评论)

《高科技与产业化》杂志

全部作者的其他最新博文

全部精选博文导读

相关博文

高科技与产业化杂志分享 http://blog.sciencenet.cn/u/hitech http://www.hitech.ac.cn

博文

享受做科研的快乐——专访中国科学院院士陆汝钤

当前推荐数：1 推荐人： 强涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

《高科技与产业化》杂志

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：1 推荐人：强涛

该博文允许注册用户评论请点击登录评论 (0 个评论)