科学文化足迹分享 http://blog.sciencenet.cn/u/lvnaiji 邮箱:naijilv@gmail.com

博文

数据折叠与人工喂养人工智能 精选

已有 10027 次阅读 2018-4-14 12:25 |个人分类:杂谈|系统分类:人文社科| 人工智能, 贵州省, 数字小镇, 数据折叠, 人机回圈

人工智能的发展如火如荼。其背后必不可少的要素之一,供机器学习的大数据采集工作,如今依然出自人工之手。在因大数据而在中国西部异军突起的贵州省的深山之中,就有一群大数据采集者,他们是“人工智能背后的人工”。

 2a3bc32652c4c4ecf58233ea48f5acf.png

由贵阳市区沿着刚修好的公路驾车50多公里,就到了百鸟河数字小镇。小镇上一个容纳400多人的数据工场,电脑前坐满了来自附近一家扶贫高职的学生。学生来自各个专业,来这里主要进行数据标注的实习。把人工智能需要识别的数据,通过分类、画框等方式标注出来。标注好的数据将用于“人脸识别、无人驾驶、语音识别”等高科技项目。譬如,把道路上的汽车、行人、红绿灯等框起来,用于自动驾驶的训练等等。

9bd57ca0a02f0fe60ae34f863c89617.png

数据标注部接到新项目,采集不同场景下的三十二套动作,学生们按照图纸中的指定姿势拍下照片。数据标注是劳动密集型行业,门槛不高,经过几天培训就能上手。每天上班七八个小时,一个月挣两千元,是笔不错的收入。这些学生自己的家乡属于贫困帮扶地区,网络闭塞,4G网络信号还没延伸到这里,村里面没几户人家能上网,更别提人工智能和大数据了。

2018年3月26日,一家互联网公司在北京发布了首款人工智能视频音箱。音箱的语音识别大数据,正是出自于像小纯这样的标注员。随着人工智能产业的飞速发展,需要的数据量也在持续增加,贵州那家数据工场的400多人,已经不能够满足甲方的要求。紧邻工场,又租下了一幢三层的楼,等待装修好继续扩招标注员工。

想起卓别林的《摩登时代》。100多年过去了,就这些学生而言,人机关系依旧。区别在于,在流水线上,卓别林做的是单调重复的体力劳动,人是机器;在“数字小镇”,学生们做的事同样单调重复,只不过是脑力劳动,人是“数字机器”。

学生小纯对未来前途感到迷茫,“即使数据标得再好,还是没有前途。”

2d67ae20c06f428894da09a2526b725.png

“数字机器”只能偶尔显示生命的鲜活。

傍晚下班,小纯在路旁看见一簇花开了,赶紧拿起手机过去拍,“花开很美,可惜白天没有时间去看它最美的样子。”

这是人工智能产业链的一部分,“供给侧”。眼下,贫困山区中坐在电脑前框图的高职学生,这些年轻人也是“人机回圈”中的一部分。人机回圈的另一部分是“需求侧”,是一线大城市的自动驾驶研发和语音识别、图像识别等其他人工智能。

小纯和同学们正在源源不断地为北上广深的人工智能公司提供数据。他们想象不到,在人工智能“需求侧”一侧的模样。学生对被自己框住的汽车一概不了解,时常会好奇,标注里的SUV长什么样,无人驾驶是不是真的安全,还要不要考驾照等等。

在人机回圈的两部分人,供给侧和需求侧之间存在着被忽视的“数据折叠”。

在数字小镇,小纯、小广和同事们正在“以人工喂养人工智能”。卓别林“喂养”的是没有生命不会长大的机器。人工智能不一样,在“喂养”中一步步长大,最终可以轻而易举地把需求侧扩展到数字小镇。阿法元干脆把人机回圈中的这部分人淘汰出局。

在热潮背后,小广和他的同学也在担心着,他们教会了机器人学习工作,而未来的机器人会不会取代他们。http://slide.news.sina.com.cn/z/slide_1_64237_257098.html#p=4

看来,他们的担心多半多余。在中国,只要存在这样廉价的数字工人,人工智能产业链的需求侧就不会主动延伸和覆盖到这样的供给侧。在以大数据著称的贵州省,脱困脱贫有待时日。成为人工智能产业链供给侧的一个环节来喂养人工智能,或将是一段时期的客观事实。

因而,数据,依然不得不折叠。

 




https://blog.sciencenet.cn/blog-210844-1109013.html

上一篇:中美贸易战遐思(1)科学理性、技术理性与价值理性
下一篇:中兴事件之问:为何“举国之力”没有用到芯片上,或者用了没有效
收藏 IP: 49.75.185.*| 热度|

10 武夷山 李剑超 姬扬 陈楷翰 尤明庆 徐勇刚 张翠娟 李方和 zjzhaokeqin yangb919

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 02:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部