|
引用本文
蒲志强, 易建强, 刘振, 丘腾海, 孙金林, 李非墨. 知识和数据协同驱动的群体智能决策方法研究综述. 自动化学报, 2022, 48(3): 627−643 doi: 10.16383/j.aas.c210118
Pu Zhi-Qiang, Yi Jian-Qiang, Liu Zhen, Qiu Teng-Hai, Sun Jin-Lin, Li Fei-Mo. Knowledge-based and data-driven integrating methodologies for collective intelligence decision making: A survey. Acta Automatica Sinica, 2022, 48(3): 627−643 doi: 10.16383/j.aas.c210118
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210118?viewType=HTML
文章简介
关键词
群体智能, 知识与数据协同, 多智能体, 决策智能
摘 要
群体智能系统(Collectire intelligence, CI)具有广泛的应用前景. 当前的群体智能决策方法主要包括知识驱动、数据驱动两大类, 但各自存在优缺点. 本文指出, 知识与数据协同驱动将为群体智能决策提供新解法. 本文系统梳理了知识与数据协同驱动可能存在的不同方法路径, 从知识与数据的架构级协同、算法级协同两个层面对典型方法进行了分类, 同时将算法级协同方法进一步划分为算法的层次化协同和组件化协同, 前者包含神经网络树、遗传模糊树、分层强化学习等层次化方法; 后者进一步总结为知识增强的数据驱动、数据调优的知识驱动、知识与数据的互补结合等方法. 最后, 从理论发展与实际应用的需求出发, 指出了知识与数据协同驱动的群体智能决策中未来几个重要的研究方向.
引 言
群体智能 (Collective intelligence, CI) 起源于对群居性生物及人类社会性行为的观察研究, 因其分布性、灵活性和健壮性等优势, 为很多极具挑战的复杂性问题提供了新的解决方案, 是新一代人工智能重点发展的五大智能形态之一. 进一步, 由无人机、无人车等自主无人平台组成的无人集群系统获得长足发展, 在智能交通管控、区域物流调度、机器人集群控制、复杂网络同步等领域取得了一系列研究和应用成果. 特别是在军事智能领域, 群体智能已被认为是有可能带来颠覆性变革的新技术, 国内外纷纷部署相关研究项目, 如美国的“进攻性蜂群使能战术” (Offensive swarm-enabled tactics, OFFSET)项目、“拒止环境中的协同作战” (Collaborative operations in denied environment, CODE) 项目, 印度2019年发布的首个无人机集群概念项目“空射弹性资产群” (Air-launched flexible asset-swarm, ALFA-S), 国内中国电子科技集团、北航、国防科大等开展的无人机集群试飞项目等.
尽管群体智能已成为当前发展热点, 但现今并没有关于这一概念的统一定义. 不同学者从生物群体智能、人群智能、多智能体系统、复杂网络、演化博弈论等截然不同的学科视角出发展开研究, 从不同侧面取得了丰富的研究成果. 本文统一称其为“群体智能”, 并选择其对应英文为Collective intelligence. 一方面因为在我国新一代人工智能中, 群体智能已显性地成为一种智能形态, 此时已有必要将不同学科下的概念加以融合; 另一方面CI在英文文献中的内涵也更为广泛, 能相对更好地与“群体智能”这一概念相对应. 特别地, 本文将融合控制论等学科进展, 较多着墨于由无人系统这类物理平台组成的群体系统. 因此, 本文在谈及统一性概念时采用“群体智能”, 而在具体问题中则可能结合上下文称这样的系统为“集群系统”“多智能体系统”等.
当前群体智能决策主要基于两大类方法: 知识驱动和数据驱动. 知识驱动方法可充分利用已有知识, 包括已有模型与算法知识、规则经验知识以及特定领域知识. 知识的广泛内涵便于实现多学科知识的灵活集成; 同时, 许多基于模型的知识驱动方法具有完备的理论支撑体系, 在分析算法稳定性、最优性、收敛性等方面具有天然优势; 此外, 知识驱动模型具有更好的可解释性; 而知识作为一种数据和信息高度凝练的体现, 也往往意味着更高效的算法执行效率. 但在实际应用中, 特别是大规模群体协同等复杂问题中, 群智激发汇聚的知识机理尚不完全清晰, 知识获取的代价高昂, 同时现有知识难以实现复杂群体行为庞大解空间的完备覆盖, 也难以支持集群行为的持续学习与进化. 近年来广泛兴起的深度强化学习等数据驱动方法具有无需精确建模、能实现解空间的大范围覆盖和探索、从数据中持续学习和进化、算法通用性强等特点, 同时拥有海量开源模型和算法库等工具支撑. 然而, 这类方法在理论特性分析上往往存在困难, 其典型的“黑箱”特性也带来了可解释性差等问题; 同时, 其高度依赖高质量的大数据, 而在群体智能应用中, 这类数据本身较难获取; 此外, 随着群体规模和问题复杂度的提升, 解空间维度灾难问题为学习效率带来了严峻挑战; 而其依赖庞大算力的特点也使得个人或一般性机构在开展研究时面临严重瓶颈. 知识驱动与数据驱动方法的主要优缺点总结如图1所示.
图 1 知识驱动和数据驱动各自优缺点
基于上述分析, 将知识驱动和数据驱动两大类方法相结合, 利用各自优势, 形成知识与数据协同驱动的新方法路径, 有望为群体智能系统研究和应用提供更为广阔的空间. 这类方法尽管在近年来逐步受到关注, 但尚未形成体系. 为此, 本文首先对知识驱动和数据驱动概念进行定性界定, 在此基础上系统梳理了知识与数据协同驱动可能存在的不同方法路径, 主要从知识与数据的架构级协同、算法级协同两个不同层面进行了方法归类, 总体框架如图2所示. 在架构级协同层面, 从个体架构、群体架构两方面介绍常见架构体系, 为复杂群体协同问题提供总体解决框架; 在算法级协同层面, 进一步划分为算法的层次化协同、组件化协同, 并在每类协同方法中具体选取了若干代表性方法进行介绍. 这里, 架构级协同和算法级协同间的区别和关联在于, 前者为复杂问题的解决搭建了基础框架, 这为各类知识驱动、数据驱动以及知识与数据协同驱动的算法提供了“容器”, 体现为不同算法间的逻辑关系; 而算法级协同则主要探讨具体算法内部如何协同运用知识与数据的相关要素, 体现为某类算法内的逻辑关系. 在对上述两大类协同方法进行详细介绍后, 本文最后从群体智能理论进一步深化、应用进一步落地等实际需求出发, 指出了知识与数据协同驱动的群体智能决策中未来几个重要的研究方向. 值得说明的是, 由于知识与数据驱动的外延极其广泛, 学科交叉特点十分明显, 本文难以覆盖所有方法, 但致力于系统地为知识与数据协同驱动这类极具潜力的方法开启讨论, 并为当前群体智能以及机器学习两大热点领域各自及其交叉领域的研究提供必要借鉴.
图 2 知识与数据协同驱动总体框架
作者简介
蒲志强
中国科学院自动化研究所综合信息系统研究中心副研究员. 2014年获得中国科学院大学控制理论与控制工程博士学位. 主要研究方向为群体智能, 多智能体强化学习, 无人系统鲁棒自适应控制. 本文通信作者.
E-mail: zhiqiang.pu@ia.ac.cn
易建强
中国科学院自动化研究所综合信息系统研究中心研究员. 1992年获得日本九州工业大学自动控制博士学位. 主要研究方向为智能控制, 智能机器人, 自主无人系统.
E-mail: jianqiang.yi@ia.ac.cn
刘 振
中国科学院自动化研究所综合信息系统研究中心副研究员. 2015年获得中国科学院大学控制理论与控制工程博士学位. 主要研究方向为飞行控制, 鲁棒自适应控制, 多智能体强化学习.
E-mail: liuzhen@ia.ac.cn
丘腾海
中国科学院自动化研究所综合信息系统研究中心助理研究员. 2016年获得北京航空航天大学控制理论与控制工程硕士学位. 主要研究方向为智能决策, 多智能体, 自主无人系统应用.
E-mail: tenghai.qiu@ia.ac.cn
孙金林
江苏大学电气信息工程学院副教授. 主要研究方向为鲁棒与自适应控制, 计算智能, 抗干扰控制.
E-mail: jinlinsun@outlook.com
李非墨
中国科学院自动化研究所综合信息系统研究中心助理研究员. 2017年获得中国科学院大学计算机应用技术博士学位. 主要研究方向为遥感图像处理, 计算机视觉, 智能感知.
E-mail: lifeimo2012@ia.ac.cn
相关文章
[1] 俞文武, 杨晓亚, 李海昌, 王瑞, 胡晓惠. 面向多智能体协作的注意力意图与交流学习方法. 自动化学报. doi: 10.16383/j.aas.c210430 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210430?viewType=HTML [2] 于洪, 何德牛, 王国胤, 李劼, 谢永芳. 大数据智能决策. 自动化学报, 2020, 46(5): 878-896. doi: 10.16383/j.aas.c180861 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180861?viewType=HTML [3] 王晓, 韩双双, 杨林瑶, 曾轲, 王飞跃. 基于ACP的动态网民群体运动组织建模与计算实验研究. 自动化学报, 2020, 46(4): 653-669. doi: 10.16383/j.aas.c190641 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190641?viewType=HTML [4] 孙长银, 穆朝絮. 多智能体深度强化学习的若干关键科学问题. 自动化学报, 2020, 46(7): 1301-1312. doi: 10.16383/j.aas.c200159 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200159?viewType=HTML [5] 张晓东, 高绍姝, 刘新平. 多速率分布式预测控制及其在热连轧活套系统中的应用. 自动化学报, 2018, 44(5): 935-942. doi: 10.16383/j.aas.2017.c160355 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c160355?viewType=HTML [6] 李长生, 王玉振. 端口受控哈密顿多智能体系统的输出一致性协议设计. 自动化学报, 2014, 40(3): 415-422. doi: 10.3724/SP.J.1004.2014.00415 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2014.00415?viewType=HTML [7] 罗小元, 杨帆, 李绍宝, 关新平. 多智能体系统的最优持久编队生成策略. 自动化学报, 2014, 40(7): 1311-1319. doi: 10.3724/SP.J.1004.2014.01311 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2014.01311?viewType=HTML [8] 王大志, 刘士新, 郭希旺. 求解总拖期时间最小化流水车间调度问题的多智能体进化算法. 自动化学报, 2014, 40(3): 548-555. doi: 10.3724/SP.J.1004.2014.00548 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2014.00548?viewType=HTML [9] 李中奇, 杨辉, 张坤鹏, 付雅婷. 基于多智能体模型的动车组分布式预测控制. 自动化学报, 2014, 40(11): 2625-2631. doi: 10.3724/SP.J.1004.2014.02625 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2014.02625?viewType=HTML [10] 高维尚, 邵诚. 复杂非凸约束优化难题与迭代动态多样进化算法. 自动化学报, 2014, 40(11): 2469-2479. doi: 10.3724/SP.J.1004.2014.02469 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2014.02469?viewType=HTML [11] 曾莉, 胡广大. 含通信延时及输入延时的线性多智能体的一致性. 自动化学报, 2013, 39(7): 1133-1140. doi: 10.3724/SP.J.1004.2013.01133 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.01133?viewType=HTML [12] 罗小元, 邵士凯, 关新平, 赵渊洁. 多智能体最优持久编队动态生成与控制. 自动化学报, 2013, 39(9): 1431-1438. doi: 10.3724/SP.J.1004.2013.01431 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.01431?viewType=HTML [13] 窦全胜, 李国江, 史忠植, 姜平. 三维网格空间上的自组装模型. 自动化学报, 2012, 38(10): 1595-1601. doi: 10.3724/SP.J.1004.2012.01595 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2012.01595?viewType=HTML [14] 余宏旺, 郑毓蕃. 多智能体系统在分布式采样控制下的动力学行为. 自动化学报, 2012, 38(3): 357-365. doi: 10.3724/SP.J.1004.2012.00357 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2012.00357?viewType=HTML [15] 严卫生, 李俊兵, 王银涛. 受损多智能体系统的信息一致性. 自动化学报, 2012, 38(11): 1880-1884. doi: 10.3724/SP.J.1004.2012.01880 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2012.01880?viewType=HTML [16] 康琦, 汪镭, 安静, 吴启迪. 基于近似动态规划的微粒群系统参数优化研究. 自动化学报, 2010, 36(8): 1171-1181. doi: 10.3724/SP.J.1004.2010.01171 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.01171?viewType=HTML [17] 熊伟清, 魏平. 二进制蚁群进化算法. 自动化学报, 2007, 33(3): 259-264. doi: 10.1360/aas-007-0259 http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0259?viewType=HTML [18] 郭锐, 吴敏, 彭军, 彭姣, 曹卫华. 一种新的多智能体Q学习算法. 自动化学报, 2007, 33(4): 367-372. doi: 10.1360/aas-007-0367 http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0367?viewType=HTML [19] 王洪泊, 曾广平, 王宗杰, 涂序彦. 软件人群体智能自律协调模型研究及应用. 自动化学报, 2007, 33(9): 924-930. doi: 10.1360/aas-007-0924 http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0924?viewType=HTML [20] 欧海涛, 张卫东, 许晓鸣. 基于一般和随机对策论框架下的多智能体学习. 自动化学报, 2002, 28(3): 423-426. http://www.aas.net.cn/article/id/15536?viewType=HTML
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 20:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社