生态学时空分享 http://blog.sciencenet.cn/u/lionbin 自我营造一个可持续发展的学术生态系统

博文

人类计算(续):人类计算系统进化历程与挑战

已有 8633 次阅读 2016-1-24 10:32 |个人分类:读书笔记|系统分类:科研笔记| 挑战, 众包, 历程, 人类计算

有关人类计算(Human computation)这个概念,我接触已经有一段时日了。上周末,终于有时间将自己的认识与有关知识进行整合,成为一篇博文“人类计算:人类认知与机器的互联”。在撰写这篇博文中,顺便检索了一些资料,现在整理这些资料,又是一次愉快的阅读之旅。

Science周刊的网站,今年开始改版了,条目编排更加清晰,字体搭配更加和谐。总之,我喜欢!而就在元旦出版的新年第1期中,发表了一篇题为“The power of crowds”(众人的力量)的文章,也是谈论与人类计算有关的话题。文章介绍了人类计算系统进化的基本历程,借助一些人类计算项目中著名的故事,探讨了如何联合人类和机器的力量解决世界的新难题,或者是历史上遗留的一些棘手问题。

为了让我们能更深刻地理解这篇文章,还是先按照作者的行文顺序,介绍一下人类计算系统进化的三个历程(图1):


图1 人类计算系统的进化(Pietro Michelucci, and Janis L. Dickinson, 2016)


(A)微任务化(microtasking):众包(crowdsourcing )一般将一个复杂的大任务分解成许多微任务(microtasks),称为微任务化,每个人都能参与完成一部分工作。这些微任务一般是机器所欠缺而人类所擅长的东西,比如借助了人类高超的视觉感知能力对图像进行分类。这样通过友好的用户界面将分解的微任务交付给一大群人来完成,然后将获得的数据聚合后进行下一步处理。例如,美国普林斯顿大学的神经科学实验室在开展一项名为Connectome的科学研究,其最终目的是解开人类大脑之谜。在项目执行过程中,就开发了一款名为EyeWire绘制大脑神经元网络的在线游戏,通过将神经细胞三维图像化的过程制成游戏,玩家需要通过从大型三维显微图像数据集中分离单个细胞来绘制结构和相应的神经元连接,并将其涂色,从而完成复杂脑神经图的三维图像,帮助研究人员探讨人的神经元细胞的连接关系,如何影响人的情绪、反应以及如何造成与神经相关的疾病等。这一过程对普通人而言是非常简单的,仅需具备一定的图像、空间识别能力,通过鼠标移动、点击等操作便能完成,但这个过程对目前世界上运算速度最快的超级计算机也是一件难事。所以,Eyewire的宣传语上说:解决大脑的奥秘,我们需要比超级计算机更为强劲的能力,那就是你。该游戏吸引了145个国家的165000多名公民科学家(玩家)的参与。这种让人们用游戏的方式参与到严肃的医学研究中,在人们在享受玩游戏乐趣的同时,还能为科学研究做贡献,真正成了有些科学大佬所说的“玩”科学。这个工作第一次提供了哺乳动物视网膜的神经元结构和组织如何产生检测运动的功能。视觉微任务化还被用来加快医疗分析,例如MalariaSpot项目,其中有22个休闲游戏玩家参与计数寄生虫,而他们工作的质量正如一个训练有素的病理学家那样准确。还有项目将居民贡献的照片拼接起来,决定在扑灭一场森林大火中从什么地方喷水更有效。

显然,微任务化非常适合于一些问题,它们可以通过重复应用相同的简单过程来解决一个更大数据集的每一个部分,如上面列举的几个例子。但是,微任务化本身在处理一些棘手问题时也是有些力不从心的,比如有关气候变化、疾病、和地缘政治冲突等问题。因为这些问题是动态的,涉及到多重、交互的系统,需要丰富的全局知识体系,进行多步推理和创造性抽象才能获得一个新的减缓策略。相信未来的人类计算生态系统有巨大的潜力来帮助解决这些棘手问题,但目前正在不太棘手的环境中进行探索。

(B)工作流程(workflow):将复杂工作流程分配给众多参与者,每个人在各步的作用就是在前一个参与者的基础上使用和增加更多信息。直到最近,由于缺乏支持性基础设施,超越简单微任务的系统不得不从头开始创建。今天,工作流工具出现了加速发展,并改善了人类计算系统的可靠性。设计日益复杂的系统还需要增加对人机反馈环的理解。例如,系统可以设计为增强人的贡献。CrowdCrit就是这样的情况,可为用户的图形设计提供专业评价,就是利用了人的输入去指导计算机实现更高效的工作。它通过将领域知识构建到工作流程中,可让非专家参与者通过指导可提供类似专家的反馈。在CrowdCrit中,计算机增强了人类的能力,但反过来也是可能的:人类的输入可指导计算机变得更加有效,正如在交互式遗传算法中所看到的,其应用自然选择的过程开发出新的解决方案。这些算法变异、重组和修剪成各种候选解决方案,以确保各思想的每一个连续世代都比之前的有所改进。然而,在真实世界的应用中实现这种算法通常需要各种场景的知识和挣脱机器限制的认知能力。通过人类的努力做到电脑不能做的步骤,如生产、结合和评估想法。

(C)解决问题的生态系统(problem-solving ecosystem):在营造解决问题的生态系统中,研究人员正开始探索如何把许多人类的认知过程与基于机器的计算结合起来,建立复杂的可信模型,这样构建的相互依赖系统,成为解决世界上最具有挑战性问题的基础。这些系统的原型提供了在线工作空间,允许参与者参与开放性活动,在现实世界中他们可贡献、结合、修改、连接、评估、并在一个共同的分析框架内集成数据和概念,在某些情况下,定制或采取行动。例如,数学家合作的在线平台“博学项目”(Polymath Project)帮助证明了一个长达80年之久的数学定理,以及面向大众的精细化新闻制作系统(ePluribus Problem Solver)只是根据分发给普通公共参与者的少量照片就产生了一个真实的准确性和构建良好的新闻文章。在这两个案例中,不同的参与者合作产生了具有实时集体智慧的新洞见,及时地交流思想创造出新的知识。而不是先收集人类的输入,然后再处理。人们串联起来,各自独立的工作,从群体社区中获得新奇的观点,并允许多个可见的解决方案。在Polymath Project中,人类贡献者坚持建立一系列基本规则,而在ePluribus中,计算机程序及其用户界面加强了这个基本规则。文章中还说,这些生态系统承诺可以更有效地应对灾害以及长期棘手问题的挑战,如气候变化和地缘政治冲突等

人类计算需要与传统的计算机科学有所区分,并且能从基于对人类认知、动机、错误率和决策理论的集成理解的设计方法中受益。文章认为,在大多数人类的计算系统中,少量的参与者做大部分的工作。鉴于这种不寻常的工作分配,我们需要提高我们的认识,如何募集和保持最多的参与者,增强技能开发,让参与者对项目的总体贡献最大化。人类输入、信息共享和基于机器的协同处理工作对于效率最大化来说可能是更具挑战性的。机器会给出预测输出,这样错误总是可以追溯到错误代码或设计,但人类是难以根据他们的投入和工作质量进行预测的。

伴随公民科学出现的众包是志愿服务的一种形式,但现在跨越了从工作(付费的微任务)到玩耍(游戏)的整个范围。随着越来越多的工作需要在众包环境中完成,我们需要考虑劳动力、失业率和经济意味着什么。一方面,众包为企业提供了随需应变的劳动力;然而,它目前处于劳动法的管辖范围之外。所以必须保护众包工作者(crowdworkers)没有受到剥削。

一些人认为更快的计算机处理速度将最终建立起基于机器智慧和人类智慧之间的桥梁,人类计算为把人和机器各自优点进行结合中已经提供一个巨大的机会,达到短期内无法获得的能力。然而,涉及到透明度、知情同意和有意义选择的群体驱动指导是新出现的伦理和社会影响越来越普遍,并在线上参与中以不同形式出现。还有一些非法使用也可能产生一些副作用,如虚假的信息工程,其中人类计算系统是为了制造恐慌、窃取信息或操纵意志是一个重要问题,不能忽视。文章指出,以社群驱动的方式,能指引产生出透明的信息和有价值的结果,利用道德规范能让人类计算做到以人为本,服务人们的合理需求。


参考文献:

Pietro Michelucci, Janis L. Dickinson, The power of crowds. Science, 2016-01-01, Vol. 351, Issue 6268, pp. 32-33

人类计算——众人拾柴火焰高 http://sss.bnu.edu.cn/?research_show/tp/234/lid/272.html




http://blog.sciencenet.cn/blog-502444-952171.html

上一篇:人类计算:人类认知与机器的互联
下一篇:大科学之父劳伦斯,科学英雄还是警世寓言?

4 刘钢 彭真明 clp286 xiyouxiyou

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-3-3 04:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部