王飞跃的个人博客分享 http://blog.sciencenet.cn/u/王飞跃

博文

平行数据:从大数据到数据智能* 精选

已有 6148 次阅读 2018-3-14 07:59 |系统分类:论文交流

平行数据:从大数据到数据智能*

 

刘昕  王晓  张卫山  汪建基  王飞跃


【摘要】 为了解决实际问题,大数据分析处理系统需要获取数据,然而实际场景中收集到的实际数据通常是不完备的。另外,大多数问题的解决方案通常是由问题引导或者仅仅进行数据分析,运行参数调整和设定带有较大的盲目性,难以达到应用的智能性。为此,本文提出一种平行数据的概念和框架,根据实际数据经计算实验产生真正的虚拟大数据,结合默顿定律,以期待的解决方案与问题进行广义对偶,引导大数据聚焦到实际问题。实际数据与虚拟数据动态互动,平行演化,形成一个虚实相生、数据动态变化的过程,最终使数据具备智能,进而解决未知的问题。平行数据不但是一种数据表示形式,更是一种数据演化机制与方式,其特色是虚实互动,所有数据的动力学轨迹构成了数据动力学系统。平行数据为数据处理、表示、挖掘和应用提供了一个新的范式。

【关键词】 大数据,平行数据,智能数据,计算实验,智能数据合约,数据动力学轨迹,平行数据机器,数据智能

Parallel Data: From Big Data to Data Intelligence

 

LIU Xin,WANG Xiao,ZHANG Weishan,WANG Jianji,WANG Fei-Yue


Abstract:For many real world applications, data available from actual scenes are generally incomplete and conditional. Therefore, a mechanism of generating big data from small data and then producing small but precise knowledge for specific problems is extremely useful. To this end, the concept and framework of parallel data are proposed and discussed. Parallel data consist of virtual data from experimental computing and real  data collected for  actual problems. Actual and virtual data interact and co-evolute in parallel, making virtual and actual complement, thus enabling the process of transferring big data to data intelligence for general problem solving. Parallel data is not only a new data representation method, but also a new mechanism for data generalization and evolution. The dynamic trajectories of all data constitute a data dynamic system, and provide a new paradigm for data processing, representation, mining, and applications. 


Key Words: Big Data, Parallel Data, Smart Data, Computational Experiment, Smart Data Contract, Data Dynamic Trajectories, Parallel Data Machine, Data Intelligence


1 引言

密集型数据发现技术使得商业生产力和技术的竞争汇聚成大数据的探索[1-3]。大数据已成为解决复杂系统知识挖掘与处理的一种有效手段。由于其可能以及已经带来的生产效率、知识发现与决策水平的提升使得大数据技术的研究与开发工作得到了突飞猛进的发展。目前,大数据分析已经应用到社会各领域中,包括智能交通、财经、制造、医疗保健、舆情分析以及其他领域和专业行业。


与此同时,大数据的研究与应用面临不同层面的很多挑战[4-7]例如:在技术层面,丰富的数据来源错综复杂,如何能够针对特定业务对多源异质数据进行有效规范化和清洗[8],如何对数据进行高效率的存储和索引以利于高效率的查询分析[9,10];如何将大规模数据可视化等;从管理层面,由于数据壁垒,如何能够获得有效数据,并在实际知识挖掘系统中使用这些数据,从而避免大数据研究无数据可用的尴尬;如何解决数据分析对数据共享的需求与用户隐私之间的矛盾。密集型数据发现系统的理念是数据必从实际业务系统中来,进而通过分析这些数据,指导现实系统的运行[11-14],解决实际问题才是大数据的本质所在。


根据“多重社会”的观点[11]以及“平行宇宙”假说[15],复杂系统分析时应采用“多重世界”的观点, 即对复杂系统进行描述不再以逼近某一实际的复杂系统的程度作为唯一标准, 而将复杂系统的模型认为是一种“现实”,是实际复杂系统的一种可能的替代形式和另一种可能的实现方式, 而实际复杂系统也只是可能出现的现实中的一种, 其行为与模型的行为“不同”但却“等价”[13-14,16]。因此,可以认为,仅仅从实际数据进行分析,无法从理论上验证实际系统所可能产生的所有场景,从而也很难以最优的方式指导实际运行的系统,因为现实系统的数据并不完美、不完备。


如何在不完备、不完美的数据情景下,根据期待的解决方案,引导产生更加完备的数据,解决数据缺乏问题,是目前大数据解析所需要解决的难题。利用默顿定律,可以根据目标引导而产生虚拟数据,经过对虚拟数据的处理,得到相应的分析结果,如何应用到实际系统中,从而实现虚拟数据与实际系统数据互动,实现真正的数据智能,以优化的方式解决具体的业务问题,提升业务价值,是目前大数据处理所面临的另一个问题。


而对于实际数据,通过去噪、归一化等处理后如何聚焦到实际问题,如何对模型参数进行精细调整,确定相应的参数和条件,以一种更优化和智能的方式运用到实际问题中, 是目前大数据面临的一个瓶颈问题。而获得这些参数和条件,仅仅依赖于现实的不完美、不完备的数据,以及实际运行系统本身,也是不现实的。


中国科学院自动化所王飞跃研究员于2004 年提出了平行系统的思想, 试图用一种适合复杂系统的计算理论与方法解决社会经济系统中的重要问题。其主要观点是利用大型计算模拟、预测并诱发引导复杂系统现象, 通过整合人工社会、计算实验和平行系统等方法, 形成新的计算研究体系[12-14]。在过去的10多年中, 平行系统不断丰富和完善起来[12-50],平行系统这一研究体系在实践中取得了大量的成果, 已经应用到智慧交通[17-29]、社会计算[30-37]、智慧农业[38]、视觉计算[39-41]、机器学习[42-45]、机制设计[46]经济计算[47-50]等领域,并取得了良好的效果。


为此,我们尝试将平行系统的思想扩展并引入到大数据领域建立一种新型理论框架,为数据处理、表示、挖掘和应用提供了一个新的范式,以期待的解决方案为引导,实现将大数据聚焦为智能小数据,解决具体的实际问题。


2 基本概念与框架

王飞跃提出的ACP理论中,人工社会 (Artificial societies)、计算实验 (Computational experiments)、平行执行(Parallel execution)有机组合形成一个平行系统[12]。基于ACP理论我们提出了平行数据的框架,如图1所示。平行数据由实际数据和虚拟数据构成,根据实际数据经计算实验产生虚拟大数据,虚拟大数据由相关问题期望的解决方案引导,聚焦生成小数据、小知识,这个小数据是智能的,面向实际问题,但不同于实际数据。

1.png

1 平行数据的框架

Fig. 1 The framework of parallel data


针对具体问题从实际环境收集的数据形成实际数据。实际数据可能杂乱无章,包括重复记录、缺失数据、错误数据、多源异构数据、噪声等不规范和与应用场景无关的数据,由于各种条件所限,无法获取完整的环境数据,同时具有稀疏性和高维性,因此基于实际数据往往难以分析获得针对具体问题的精准解决方案。实际数据与具体问题直接相关,以其为基础生成虚拟大数据。


为了弥补实际数据在时间、空间、尺度、来源等方面的不足,在实际数据的基础上,通过计算实验,构造虚拟大数据,采用对偶技术虚实互动,修订、补足和平滑数据。多次对偶之后,虚拟数据的分布逼近实际数据并逐渐完备。虚拟数据是真正的大数据,其大小由对偶关系和实验量决定。


完备的虚拟大数据将能够涌现出多种特征和规律,通过多角度观察,如语义分析、关联规则分析、情感推理等实现数据理解,能够发现数据的这些特征和规律。


为了进行数据实验,根据虚拟数据展现的特征清洗实际数据和虚拟数据使其规范,补充数据使其均匀。应用数据理解发现的规律,有计划地选取多组虚拟数据进行多组数据实验,应用深度学习等技术对虚拟大数据进行处理、分析和挖掘,多组实验将呈现多种实验结果;用期待的解决方案指导数据理解,优化数据分析方法。


数据实验后,根据针对实际问题预设的解决方案进行引导,从虚拟数据提取隐藏在数据规律里的有价值的信息,优化融合多种实验结果,基于问题的相关规则进行人工实验,使虚拟大数据聚焦至具体问题,构建实际问题的解空间,数据具有了智能,进而解决未知的问题。


3 平行数据新范式

平行数据为大数据处理,挖掘,表示和应用提供了一个新的范式。根据以上提出的平行数据概念框架,我们提出了平行数据运行的新范式,如图2所示。


我们首先设定预期问题的解决方案,应用广义对偶的方式,通过对于问题和相关数据的描述、预测、引导来使得系统达到控制者所期望的状态,解决过程如下。


假设有n个需要解决的问题,构成问题集T={T1T2,, Tn},其中 n的取值根据实际场景确定。针对每个问题预设的解的集合构成了解空间A={A1, A2, ,An}


从数据生成到问题解决,每个数据集经历多次循环往复的过程,每一次循环过程包括以下六个阶段:数据获取、数据清洗、数据表示、数据解析、数据智能、数据引擎。数据集在每个阶段状态不同,从获取问题相关的数据集,到解决问题的数据集,每个数据集的动态变化形成了一个动力学轨迹,该轨迹包括了实际数据集、虚拟数据集、智能数据集的动态变化过程,是小数据à大数据à小数据的过程,先扩张后收敛。每个数据集经过多次扩张收敛的过程,这样循环往复,最终收敛到精确的问题解决方案。所有数据集的动力学轨迹的总和构成了平行数据动力学系统。以下依次描述一个数据集动力学轨迹中的六个阶段。

2.png

图2 平行数据新范式

Fig. 2 The new paradigm for parallel data


3.1 数据获取

针对第i个问题Ti(1=<i<=n),收集相关实际数据形成实际数据集Di。在实际数据集的基础上生成虚拟数据集Vi,该过程是一个逐渐演化和迭代的过程,DiVi不断交互。为每个数据集和预设的期望解设置相关系数Cij,表示DiTi的相关性,也即ViTi的相关性,Cij存储到相关智能数据合约。


首先基于集合Di通过各种算法(如对抗式生成网络Generative Adversarial Networks(GAN)) [51-52])生成虚拟数据集Vi,应用对偶算法将Vi逆映射为Di,根据DiDi的差异修正映射算法,以在下次迭代时减小差异,给出生成虚拟数据时缺乏的必不可少的实际数据的需求,指导数据获取阶段有目的地收集有意义的实际数据对数据集进行补充,并重新计算相关系数Cij。以上过程经过多次迭代,在DiVi的每次互动中两个数据集都不断完善和修正,Cij不断更新,直到Vi的分布趋于Di的分布,最终形成虚拟大数据V={ V1V2,, Vn }.


3.2 数据清洗

实际环境中获取的实际数据杂乱无章,包含多种噪声,需要对其进行清洗,只保留与预设的解相关的数据。若对于任意jCij=0,则删除Di。对Di中明显不相关的和错误的数据进行清洗。对Di清洗之后形成数据集CDiCDi也会触发Vi的清洗过程,演变为CVi Di与预设的期望解决方案之间的相关系数传递给CDi


3.3 数据表示

对实际的多源、异质、稀疏数据规范化,根据应用场景将数据表示为结构化数据和非结构化数据。由于各种数据的规则、尺度、范围都不尽相同,将数据集在时间和空间论域上模糊化,形成模糊数据集。不同的模糊数据集之间存在互相关联的数据,根据这些关联对各数据集共同模糊化。FDi=fuzzy(CDi), FVi=fuzzy(CVi),其中1 ≤ i ≤ n。预设的期望解决方案与CDiCVj之间的相关系数Cij传递给FDiFVj


不同数据集之间的关联和交互通过智能数据合约实现,一个数据集状态的改变触发相应的智能数据合约。智能数据合约封装了预定义的若干状态及转换规则、触发合约执行的情景(如到达特定时间或发生特定事件等)、特定情景下的应对行动等。平行系统可实时监控智能合约的状态, 并通过核查外部数据集、确认满足特定触发条件后激活并执行合约。智能数据合约可以维持自己的状态,控制自己的数据和对接收到的外界信息或者数据进行回应[53]


3.4 数据解析

规范化之后的模糊数据集能够涌现多种数据特征和规律,通过公式和分布体现出来。用自然语言或形式化语言描述这些特征和规律,形成定理及其推论。计算每个特征和规律与预设的解决方案之间的相关系数。同时应用各种数据分析算法和关联规则发现、挖掘对于每个模糊数据集和预设的解决方案之间的关联关系、数据集之间和数据集内部隐含的深层次的关联关系,获取其中有价值的信息。与每个预设解决方案相关的智能数据合约收集并记录与其相关系数大于0的相关数据集和关联关系。


3.5 数据智能

数据解析之后形成的特征、规律以及数据之间的关联关系使得数据画像清晰。将相关系数排序[54],根据数据集和关联关系对于预设的期望解决方案的重要程度,以预设的期望解决方案为中心,对各数据集重组、融合形成新的智能数据集。其中智能数据合约起着至关重要的作用,根据事先设定的期望解决方案,设置智能数据合约触发条件。若数据集的变化满足触发条件,则对数据进行计算、添加、删除、修改等操作,实现数据分解、数据选择以及数据集之间的融合。根据模型执行数据计算之后,收集与预设的期望解决方案相关的结果数据形成智能数据集,智能数据集直接对应相应的问题。数据智能的实现如图3所示。

3.png

图3 数据智能的实现

Fig. 3 Data intelligence

 

3.6 数据引擎

每一个或多个智能数据集与一个问题相关,针对预设的期望解决方案建立数据模型,以智能数据为输入,执行数据模型,根据具体的问题融合一个或多个智能数据集中相关数据,或优化组合解空间里的多个解,得到该问题的一个解决方案。


将这个解决方案与期望的解决方案比较,根据两者之间的差距优化智能数据合约的触发条件和转换规则,进而引导每个数据集的动力学轨迹,在此期间实际数据和虚拟数据不断演化,智能数据集收敛到更精确的解空间,使得输出的问题解决方案更接近于期望的解决方案。经过这样多次广义对偶之后,平行数据能够将实际数据经过大数据分析收敛到智能数据,得到期望的解决方案。


针对一个问题或关联性强的几个问题,执行以上多次迭代的过程,形成相应的数据动力学系统,这个系统能够用已知的知识(实际数据)解决未知的问题,这是一个具备智能的机器,我们称为智能数据机器。


平行数据新范式能够解决大数据领域面临的诸多问题:在数据获取、清洗和表示阶段能够解决多源异质数据的归一化、清洗和补充;智能数据合约管理数据集之间的关联关系,进行有效的查询分析;数据解析和数据智能有助于挖掘模糊数据集中有价值的信息;生成的虚拟大数据能够减少从实际环境获取实际数据,一定程度上缓解了数据开放与隐私之间的矛盾。


4 应用示例

本文以手写汉字识别系统作为平行数据运行的一个示例。显然,我们可以根据这一过程,构建针对具体内容的各种各样的智能数据机器。


手写汉字数据库采用中科院自动化研究所脱机手写样本数据库CASIA-HWDB,该数据库包含1020人脱机手写的中文单字样本和手写文本,用Anoto笔在点阵纸上书写后扫描、分割得到,本示例使用其中手写单字样本,共有3,895,135个手写单字样本,分属7,356类,所有文字均为灰度图像。


手写汉字生成比手写数字(如MNIST)要难的多,首先英文字符分类少,而汉字总共有50000多个,常见的有3000多,其次汉字个人书写风格差异较大。


GAN主要包含两部分,即生成器和判别器,生成器主要用来学习真实图像的数据分布,从而使自身生成的图像更加真实,判别器需要对接受的图片进行真假判别。在这个过程中,生成器和判别器进行博弈,随着训练的进行,生成器和判别器不断进行对抗,生成器生成的图像接近真实的图像分布,判别器识别不出真假图像,对给定图像预测为真的概率接近0.5。手写汉字的生成可以辅助训练手写汉字识别系统的训练,生成的汉字加入到现有的数据集中。


对真实的手写汉字作为输入进行识别,若此时系统识别率没有达到期望值,则引导生成器继续生成更多的手写汉字,这些生成的汉字加入汉字模糊集,并对应至汉字库,可以减少识别不出某个汉字的情况。


在一个具体的汉字的识别过程中,对于识别为其他汉字,即识别错误的情况,如图5,火”容易识别为“大”或者“水”。此时需要增删相关汉字的模糊数据集的数据,修改智能数据合约的规则,修正判别条件,根据个人书写风格,选择正确的模糊数据集,使其识别为正确的汉字。

4.png

图4 容易识别错误的汉字

Fig. 4  The Chinese characters easily confused by the system

 

对于手写汉字识别系统的期望是提高系统的识别率。在平行数据中以高识别率为目标引导实际数据的获取,虚拟数据的生成。在未达到预期的识别率时,修正平行数据的参数,针对每个汉字,增强对每个手写汉字的识别能力,达到用户随写随识别。


5 总结与展望

本文提出了平行数据的概念和框架,平行数据作为一种新的大数据处理范式,通过虚实互动,建立一种更加有效的数据演化机制与方式。借助默顿定律根据实际数据经计算实验产生真正的虚拟大数据,以期待的解决方案与问题进行广义对偶,驱动虚拟数据运行并与实际数据互动,平行演化,动态地引导数据动力学轨迹聚焦到实际问题,得到期待的解决方案。


本文提出的平行数据机制和方法,可以经由智能数据实现知识自动化,通过数据驱动的描述智能、实验驱动的预测智能、以及互动反馈的引导智能,以“描述-预测-引导”三位一体形成的平行智能[55-58],实现从具有不确定性、多样性和复杂性特征的信息-物理-社会系统向灵捷、聚焦和收敛的智能系统的转化[59-64]。在数据实现智能化之后,针对不同的问题构建相应的智能数据机器,由智能数据机器解决各种实际问题。


本文仅仅从概念和框架上建立了一个平行数据新范式,很多细节之处尚需完备的理论证明和实际系统中进行应用。例如,如何构建智能数据合约及其触发机制和部署,数据对偶机制的实现,期望的解决方案在整个平行数据中引导数据收敛的细节等,还需要从理论到实践进行进一步研究。如何支撑平行数据的实际运行,如数据生成及数据有效性验证、数据互动机制等,尚需在前期大数据平台[65-66]基础上进行深入的研究。但是,这种虚实互动从而建立数据智能的方法,以“描述-预测-引导”三位一体形成的平行数据智能,对目前大数据领域面临的诸多挑战给出了指导方法,具有普遍的理论与实践意义。期待本文抛砖引玉, 共同对大数据智能处理的理论与实践做出更加宽广的研究。


致谢


作为芬兰建国百年庆祝活动的一部分,2017530日到63日,王飞跃与张卫山同赴赫尔辛基、坦佩雷、奥卢等城市的数所大学、企业、科研和政府机构进行学术报告,介绍平行智能和项目交流。在这些活动中,王飞跃和张卫山认识到,“平行数据”应当作为一个独立的研究领域展示,为从经典的数据挖掘到新兴的数据智能开拓一条新路。经过一路的讨论,最后在赫尔辛基市凡塔阿机场的午餐桌上,草拟了本文的大纲和主要思想。回国后,由刘昕和王晓合力完成全文。至此,平行数据、平行传感、平行图像、平行材料、平行区块、平行视觉等构成了一个整体。为此,作者向组织本次活动的中芬ICT联盟负责人Matti Hamalainen教授和芬兰卢奥大学周杰韩博士表示感谢,他们促成了本文的机缘。


[1]  WANG F Y, ZENG D, CARLEY K, et al. Social Computing: From Social Informatics to Social Intelligence. IEEE Intelligent Systems, 2007, 22(2): 79-83.

[2] CHEN C, ZHANG C. Data-Intensive Applications, Challenges, Techniques and Technologies: A Survey on Big Data. Information Sciences, 2014, 275 (11): 314-347.

[3]   WANG F Y. Moving Towards Complex Intelligence? IEEE Intelligent Systems, 2009, 24(4): 2-4.

[4] HEY T, TANSLEY S, TOLLE K. The Fourth Paradigm: Data-Intensive Scientific DiscoveryM/OL. 20170520.https://www.immagic.com/eLibrary/ARCHIVES/EBOOKS/M091000H.pdf.

[5]    吴信东, 何进, 陆汝钤, 郑南宁. 从大数据到大知识: HACE + BigKE. 自动化学报, 2016, 42(7): 965-982.

(WU X D, HE J, LU R Q, ZHENG N N. From big data to big knowledge: HACE + BigKE. Acta Automatica Sinica, 2016, 42(7):965-982.)

[6]     汪建基、马永强、陈仕涛、刘子熠、郑南宁,碎片化知识处理与网络化人工智能,中国科学:信息科学2017, 47(2): 171-192.

(WANG J J, MA Y Q, CHEN S T, et al. Fragmentation Knowledge

Processing and Networked Artificial Intelligence. Scientia Sinica(Informationis), 2017, 47(2): 171-192.)

[7]  WANG F Y. A Big-Data Perspective on AI: Newton, Merton, and Analytics Intelligence, IEEE Intelligent Systems, 2012, 27(5): 2-4.

[8]  ORACLE. The Five Most Common Big Data Integration Mistakes To Avoid [J /OL. 20170520. https://www.oracle.com/assets/big-data-integration-mistakes-wp-2492054.pdf.

[9]   MELNIK S, GUBAREV A, LONG J J, ROMER G, SHIVAKUMAR S, TOLTON M. Dremel: Interactive Analysis of Web-Scale Datasets. Theo Vassilakis Communications of the ACM, 2010, 54(6): 114-123.

[10]    BEAVER D, KUMAR S, LI H C, SOBEL J, VAJGEL P. Finding a Needle in Haystack: Facebook’s Photo StorageC/OL].[20170520].https: / / www usenix org /legacy /event /osdi10 /tech /full _ papers /Beaverpdf

[11]    王飞跃, 史帝夫·兰森. 从人工生命到人工社会——复杂社会系统研究的现状和展望. 复杂系统与复杂性科学, 2004, 1(1) : 33-41.

(WANG F Y, LANSING J S. From Artificial Life to Artificial Societies: New Methods for Studies of Complex Social Systems. Complex Systems and Complexity Science, 2004, 1(1):33-41.)

[12]    王飞跃. 平行系统方法与复杂系统的管理和控制.控制与决策, 2004, 19(5):485-489.

(WANG F Y. Parallel System Methods for Management and Control of Complex Systems Control and Decision, 2004, 19(5): 485-489.)

[13]    王飞跃. 关于复杂系统研究的计算理论与方法. 中国基础科学, 2004, 6(5): 3-10.

(WANG F Y. Computational Theory and Method on Complex Systems. China Basic Science, 2004, 6(5): 3-10.)

[14]    王飞跃. 人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论. 复杂系统与复杂性科学, 2004, 1(4): 25-35.

(WANG F Y. Artificial Societies, Computational Experiments and Parallel Systems: A Discussion on Computational Theory of Complex Social-Economic Systems. Complex System and Complexity Science, 2004, 1(4): 25-35.)

[15]    TEGMAR K M . Parallel Universes. Scientific American, 2003, 288 ( 5) : 40-51.

[16]    WEN D, YUAN Y, LI X. Artificial Societies, Computational Experiments, and Parallel Systems: An Investigation on a Computational Theory for Complex Socio-Economic Systems. IEEE Transactions on Services Computing, 2013. 6(2): 177-185.

[17]  ZHANG N, WANG F Y, ZHU F H, et al. DynaCAS: Computational Experiments and Decision Support for ITS. IEEE Intelligent Systems, 2008, 23(6): 19-23.

[18]    WANG F Y. Parallel Control and Management for Intelligent Transportation Systems: Concepts Architectures, and Applications. IEEE Transactions on Intelligent Transportation Systems, 2010, 11(3): 630-638.

[19]    宁滨, 王飞跃, 董海荣, 文丁, 刘德荣, 高士根, 王晶, 高速铁路平行控制与管理系统研究框架, 复杂系统与复杂性科学, 2010, 7(4), pp. 11-21.

(NING B, WANG F Y, DONG H R, WEN D, LIU D R, GAO S G, WANG J. Framework of Parallel Control and Management for High-Speed Railway Systems. Complex Systems and Complexity Science, 2010, 7(4): 11-21.)

[20]    WANG F Y. Parallel Driving With Software Vehicular Robots for Safety and Smartness. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(4): 1381-1387.

[21]     WANG F Y, ZHENG N N, CAO D P, MARTINEZ C M, LIU T. Parallel Driving in CPSS: A Unified Approach for Transport Automation and Vehicle Intelligence. IEEE/CAA Journal of Automatica Sinica, 2017, 4(4): 577-587.

[22]    WANG F Y, YANG L Q, YANG J, ZHANG Y, HAN S S, ZHAO K. Urban Intelligent Parking System Based on the Parallel Theory / / Proc of the International Conference on ComputingNetworking and Communications. WashingtonUSA: IEEE2016. DOI: 10. 1109 /ICCNC. 2016.7440708

[23]    LI L, WEN D. Parallel Systems for Traffic Control: A rethinking. IEEE Transactions on Intelligent Transportation Systems, 2016, 17(4): 1179-1182.

[24]    LV Y S, CHEN Y Y, ZHANG X Q, DUAN YJ, LI N Q. Social Media based Transportation Research: the State of the Work and the Networking. IEEE/CAA Journal of Automatica Sinica, 2017, 4(1): 19-26.

[25]    LV YS, DUAN Y J, KANG W W, LI Z X, WANG F Y. Traffic Flow Prediction With Big Data: A Deep Learning Approach. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(2): 865–873.

[26]    LI L, LV Y S, WANG F Y. Traffic Signal Timing via Deep Reinforcement Learning. IEEE/CAA Journal of Automatica Sinica, 2016, 3(3): 247-254.

[27]    DUAN Y J, LV Y S, LIU Y L, WANG F Y. An Efficient Realization of Deep Learning for Traffic Data Imputation. Transportation Research Part C, 2016, 72: 168-181.

[28]    LV Y S, ZHANG X Q, KANG W W, DUAN Y J. Managing Emergency Traffic Evacuation with a Partially Random Destination Allocation Strategy: A Computational-Experiment-Based Optimization Approach. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(4): 2182–2191.

[29]    DUAN YJ,LV Y S,WANG F Y. Travel Time Prediction with LSTM Neural Network. the 19th IEEE International Conference on Intelligent Transportation Systems. Rio de Janeiro, Brazil: IEEE, 2016: 1053-1058.

[30]    WANG F Y, WANG X, LI L X, LI L. Steps Toward Parallel Intelligence. IEEE/CAA Journal of Automatica Sinica, 2016, 3(4): 345-348.

[31]    王飞跃, 邱晓刚, 曾大军, 曹志冬, 樊宗臣, 基于平行系统的非常规突发事件计算实验平台研究, 复杂系统与复杂性科学, 2010, 7(4): 1-10.

(WANG F Y. A Computational Experimental Platform for Emergency Response Based on Parallel Systems. Complex Systems and Complexity Science, 2010, 7(4): 1-10.)

[32]    王飞跃.软件定义的系统与知识自动化: 从牛顿到莫顿的平行升华.自动化学报,201541( 1) : 18.( WANG F Y. Software-Defined Systems and Knowledge Automation: A Parallel Paradigm Shift from Newton to Merton. Acta Automatica Sinica, 201541( 1) : 18.)

[33]    WANG F Y, ZHANG J J, ZHENG X H, WANG X, YUAN Y, DAI X X, ZHANG J, YANG L Q. Where does AlphaGo go: from Church-Turing Thesis to AlphaGo Thesis and beyond. IEEE/ CAA Journal of Automatica Sinica, 2016, 3(2):113-120.

[34]    王飞跃, 基于社会计算和平行系统的动态网民群体研究, 上海理工大学学报, 2011, 33(1): 8-17.

(WANG F Y. Study on Cyber-Enabled Social Movement Organizations Based on Social Computing and Parallel Systems.).

[35]    王飞跃, 王晓, 袁勇等. 社会计算与计算社会: 智慧社会的基础与必然. 科学通报, 2015, 60(5-6): 460-469.

(WANG F YWANG XYUAN Yet al Social Computing and Computational Societies: The Foundation and Consequence of Smart Societies. Chinese Science Bulletin, 2015, 60( 5 /6) : 460469.)

[36]    WANG X, LI L, YUAN Y, YE P, WANG F Y. ACP-based Social Computing and Parallel Intelligence: Societies 5.0 and Beyond, CAAI Transactions on Intelligence Technology, 20161( 4) : 377393

[37]    WANG X, ZHENG X H, ZHANG X Z, ZENG K, WANG F Y. Analysis of Cyber Interactive Behaviors Using Artificial Community and Computational Experiments. IEEE Trans. Systems, Man, and Cybernetics: Systems, 2017, 47(6): 995-1006.

[38]    KANG M Z, WANG F Y. From parallel plants to smart plants: intelligent control and management for plant growth. IEEE/CAA Journal of Automatica Sinica, 2017, 4(2):161-166.

[39]    王坤峰, 苟超, 王飞跃. 平行视觉: 基于ACP 的智能视觉计算方法. 自动化学报, 2016, 42(10): 1490-1500.

(WANG K F, GOU C, WANG F Y. Parallel vision: an ACP-based approach to intelligent vision computing. Acta Automatica Sinica, 2016, 42(10): 1490-1500.)

[40]    王坤峰, 鲁越, 王雨桐, 熊子威, 王飞跃. 平行图像: 图像生成的一个新型理论框架. 模式识别与人工智能, 2017, 30(7): 577587.

(WANG K F, LU Y, WANG Y T, XIONG Z W, WANG F Y. Parallel Imaging: A New Theoretical Framework for Image Generation. Pattern Recognition and Artificial Intelligence, 2017, 30(7): 577-587.)

[41]    WANG K F, GOU C, ZHENG N N, REHG J M, WANG F Y. Parallel Vision for Perception and Understanding of Complex Scenes: MethodsFramework, and Perspectives. Artificial Intelligence Review, 2017, 48(3): 298-328.

[42]    李力, 林懿伦, 曹东璞, 郑南宁, 王飞跃. 平行学习——机器学习的一个新型理论框架. 自动化学报, 2017, 43(1):1-8.

(LI L, LIN Y L, CAO D P, ZHENG N N, WANG F Y. Parallel Learning A New Framework for Machine Learning. Acta Automatica Sinica, 2017, 43(1): 1-8.)

[43]    LI L, LIN Y L, ZHENG N N, WANG F Y. Parallel Learning: a Perspective and a Framework. IEEE/CAA Journal of Automatica Sinica, 2017, 4(3): 389-395.

[44]    白天翔, 王帅, 沈震, 曹东璞, 郑南宁, 王飞跃, 平行机器人与平行无人系统: 框架、结构、过程、平台及其应用, 自动化学报, 2017, 43(2): 161-175.

(BAI T X, WANG S, SHEN Z, CAO D P, ZHENG N N, WANG F Y. Parallel Robotics and Parallel

Unmanned Systems: FrameworkStructureProcessPlatform and Applications Parallel. Acta Automatica Sinica, 2017, 43(2): 161-175.)

[45]    段艳杰,吕宜生,张杰,赵学亮,王飞跃. 深度学习在控制领域的研究现状与展望. 自动化学报, 2016, 42(5): 643-654.

(DUAN Y J, LV Y S, ZHANG J, ZHAO X L, WANG F Y. Deep learning for control: the state of the art and prospects. Acta Automatica Sinica, 2016, 42(5): 643-654.)

[46]    ZAHNG J, LI L J,WANG F Y. A Probabilistic Mechanism Design for Online Auctions. IEEE Access, 2017, 5(5): 10782-10794.

[47] YUAN Y, WANG F Y, ZENG D. Developing a Cooperative Bidding Framework for Sponsored Search Markets-An Evolutionary Perspective. Information Sciences, 2016, 369(C): 674-89.

[48]  QIN R, YUAN Y, WANG F Y. Exploring the Optimal Granularity for Market Segmentation in RTB Advertising via Computational Experiment Approach. Electronic Commerce Research and Applications, 2017, 24: 68-83.

[49]    王飞跃,曾大军,袁勇. 基于ACP方法的电子商务系统复杂性研究. 复杂系统与复杂性科学,2008, 5(3):1-8.

(WANG F Y, ZENG D J, YUAN Y. An ACP-based Approach for Complexity Analysis of E-commerce System. Complex Systems and Complexity Science, 2008, 5(3):1-8.)

[50]    YUAN Y, ZENG D. Co-Evolution-Based Mechanism Design for Sponsored Search Advertising. Electronic Commerce Research and Applications. 2012, 11(6): 537-547.

[51]    RADFORD A, METZ L, CHINTALA S. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks C /OL.20170520. https: / /arxiv.org /pdf /1511. 06434v2. pdf.

[52]    王坤峰, 苟超, 段艳杰, 林懿伦, 郑心湖, 王飞跃. 生成式对抗网络GAN 的研究进展与展望. 自动化学报, 2017, 43(2): 321-332.

(Wang K F, GOU C, DUAN Y J, LIN Y L, ZHENG X H, WANG F Y. Generative Adversarial Networks: The State of the Art and Beyond. Acta Automatica Sinica, 2017, 43(3): 321-332.)

[53]    袁勇, 王飞跃. 区块链技术发展现状与展望. 自动化学报. 2016, 42(4): 481-94.

(YUAN Y, WANG F Y. Blockchain: The State of the Art and Future Trends. Acta Automatica Sinica, 2016, 42(4): 481-494.)

[54]    WANG J, ZHENG N. A Novel Fractal Image Compression Scheme with Block Classification and Sorting Based on Pearsons Correlation Coefficient. IEEE Transactions on Image Processing, 2013, 22(9): 3690-3702.

[55]    WANG F Y, YANG L Q, CHENG X, HAN S S, YANG J. Network Softwarization and Parallel Networks: Beyond Software-Defined Networks. IEEE network, 2016, 30(4): 60-65.

[56]    WANG F Y, ZHANG J, WEI Q L, ZHENG X H, LI L. PDP: Parallel Dynamic Programming. IEEE/CAA Journal of Automatica Sinica, 2017, 4(1): 1-5.

[57]    HU S G, SHAN L D, XU J R. Characteristics of Big-Data-Based Smart Public Decision Making. Journal of zhejiang university (humanities and social sciences), 2015, 45(3): 5-15.

[58]    WANG F Y. Toward a Paradigm Shift in Social Computing: The ACP Approach. IEEE Intelligent Systems, 2007, 22(5): 65-67.

[59]    袁勇、周涛、周傲英、段永朝、王飞跃. 区块链技术:从数据智能到知识自动化, 自动化学报,  2017, 43(9): 1485-1490.

(YUAN Y, ZHOU, ZHOU A Y, DUAN Y Z, WANG F Y. YUAN Y, ZHOU, ZHOU A Y, DUAN Y Z, WANG F Y. Blockchain Technology: From Data Intelligence to Knowledge Automation, Acta Automatica Sinica, 2017, 43(9): 1485-1490.)

[60]  ZHANG Q P, WANG F Y, ZENG D, WANG T. Understanding Crowd-Powered Search Groups: A Social Network Perspective. PLoS ONE, 2012, 7(6): 1-16.

[61]    GOU C, WU Y, WANG K, WANG K F, WANG F Y, JI Q. A Joint Cascaded Framework for Simultaneous Eye Detection and Eye State Estimation. Pattern Recognition, 2017, 67(1): 23-31.

[62]    GABOR T, BELZNER L, KIERMEIER M, BECK M T, NEITZ A. A Simulation-Based Architecture for Smart Cyber-Physical Systems. 2016 IEEE International Conference on Autonomic Computing (ICAC) (2016), Wuerzburg, Germany: IEEE, July17-22, 2016: 374-379.

[63]    GLAESSGEN E H, STARGEL D S. The Digital Twin Paradigm for Future NASA and U.S. Air Force Vehicles, 53rd AIAA/ASME/ASCE/AHS/ASC Structures, Structural Dynamics and Materials Conference, Honolulu, Hawall: AIAA/ASME/ASCE/AHS/ASC, April 23-26 , 2012: 1-14.

[64]    WANG F Y. The Emergence of Intelligent Enterprises: From CPS to CPSS. IEEE Intelligent Systems, 2010, 25(4): 85-88.

[65]    ZHAGN W S, XU L, DUAN P C, GONG W J, LU Q H, YANG S. A Video Cloud Platform Combing Online and Online Cloud Computing Technologies. Personal and Ubiquitous Computing, 2015, 19(7): 1099-1110

[66]    ZHAGN W S, XU L, LI Z W, LU Q H, LIU Y. A Deep-Intelligence Framework for Online Video Processing. IEEE Software, 2016, 33(2): 44-51.


后记:本文2017年发表在《模式识别与人工智能》第30 卷第8 期


平行数据_从大数据到数据智能.pdf 

 



http://blog.sciencenet.cn/blog-2374-1103789.html

上一篇:[转载]人们更偏爱假消息?《科学》发文探讨假消息的科学
下一篇:[转载]生于伽利略祭日,逝于爱因斯坦诞辰丨巨星陨落,纪念霍金

9 惠小强 赵克勤 强涛 李剑超 黄永义 农绍庄 孙颉 张骥 闫钟峰

该博文允许注册用户评论 请点击登录 评论 (7 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-8-20 17:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部