|
随着人工智能的崛起,一个叫ImageNET视觉识别的挑战赛(ILSVRC)在近几年里备受瞩目。
这个挑战赛要求参赛团队使用ImageNet——全球最大的图像识别数据库,测试他们系统的运行情况。
ILSVRC
而这个计算机视觉领域的“奥赛”,也一直吸引着该领域的顶级研究机构(包括微软、谷歌、百度等)为之争得头破血流。
在2015年,百度还涉嫌在测试过程中作弊,被ImageNet挑战赛提出禁赛一年。
而提起ImageNet,就不得不说它的背后的缔造者——李飞飞。
她不但是这场挑战赛背后的“美女考官”,还是ImageNet这个全球最大图像识别数据库的主创者。
李飞飞
李飞飞,这三个字几乎是AI(人工智能)界无人不晓的名字。
她不仅是斯坦福AI实验室主任,还是斯坦福大学的终身教授。
在顶级期刊上,她的高质量文章就有100篇以上,引用量更是高达33215-44773次。
2015年入选“世界百大思想者”,2016年她还被美国评为“年度杰出移民”之一,以前获此殊荣的还有爱因斯坦、基辛格等
前一阵子,谷歌宣布李飞飞成为谷歌云计算首席科学家,也在业界更是引起了不少轰动。
此前,李飞飞一直都专注于实验室,与业界联系不深。
她现在走出实验室的举动,让许多人都对人工智能的发展了充满信心。
然而,这位站在金字塔顶端的女科学家背后,却有着一段鲜为人知的励志人生。
早年的她竟然还有过清洁工、中餐馆收银员、帮人遛狗、开干洗店等工作经验。
...
1976年出生的李飞飞在四川长大。
16岁时,她便随父母远渡重洋来到充满希望的美国,落户在新泽西洲的Parsippany小镇。
但李飞飞并不是富二代,父母都是清贫的知识分子。
初到美国,对英语一窍不通更是全家最大的阻力。
光是择校问题,她就奔波了好几个月,费了九牛二虎之力才得以在当地一所排名中游的学校上学。
李飞飞一家
那时,爸爸去帮别人修相机,妈妈就去当收银员。
但这类工作的收入,完全不足维持生活和支付她的学费。
所以到美国后的很长一段时间,李飞飞生活的关键词就是“谋生”二字。
在唐人街附近的很多零工,包括收银员、清洁工、服务生等她都做过。
高中时期的李飞飞
然而在打工之余,李飞飞却还要应对两年后的美国大学入学。
作为新一代移民学子,她不但要迅速掌握英语,还要拿出一份极其优秀的成绩单,才能考上好的大学。
那时候,打工和学习几乎占满了她的全部生活。
最辛苦时,一天只睡不到4个小时。
1995年,Parsippany镇上关于李飞飞的报道
只要你想,全世界都会为你让路。
凭着这股毅力,这位华裔少女收到了普林斯顿大学计算机系的offer,还是提供全额奖学金的那种。
当时这个消息在小镇上算是个大新闻,还有报纸专门刊登了她奋斗的故事,称她的“美国梦”成真啦!
李飞飞在普林斯顿大学
在普林斯顿大学她接触到了大量优秀的人才,这对她而言更是莫大的鼓舞。
然而,在大学她依然不改拼命三郎的性格。
看着父母还是做着入不敷出的零工,李飞飞决意借钱买下了一家洗衣店,交给父母经营。
从此,她也就过上了周一到周五在普林斯顿拼命学习,周六日则赶回家中,继续当洗衣妹的日子。
她不但独立,浑身上下更是散发着对生活的热爱。
“我爱普林斯顿,也非常爱我的洗衣店”
“我觉得辛苦不算什么,因为我父母也同样在努力工作。我们一家人只是为了好好地生活。”
1999年,李飞飞从普林斯顿大学毕业。
然而,那时的她却拒绝了多家金融公司的工作邀请。
在父母的支持下,开始追随自己的内心,毅然踏上一年的西藏之路研究藏医。
李飞飞在西藏的日子
完成了这一梦想后,她再次拒绝了华尔街的高薪工作,开始了下一个梦想——读博士。
然而,在读博期间,她的母亲却不幸得了癌症,之后又中风。
生活的重担几乎压得她喘不过气来。
“人生最难的不就是,如何发挥自己最大的潜能,同时兼顾自己所身负的责任,然后又必须忠于自己的内心吗?”
而李飞飞用自己的行动告诉我们,她做到了!
...
在博士毕业后,她进入了斯坦福大学AI实验室,选择了当时不被看好的研究方向——计算机视觉识别领域。
通俗的说,就是拿一张图片,让计算机认出来这张图片所包含的内容。
比如,你告诉计算机,“猫”是由圆脸、胖身子、两只尖耳朵和一条长尾巴组成的东西。
然而在现实生活中,猫就有成千上万个品种,就算是同一只猫,也能摆出上百种姿势。
如果遇到一些骨骼清奇的猫,换个姿势计算机估计就懵逼了。
那个时候,图像识别已经走过了20个年头。
但全世界能够识别的物体也不过4到20种。
然而大千世界这么多的物品,如果计算机只能识别豹子、飞机、人脸和汽车这几样是远远不够的。
面对图像识别如此匮乏的“词汇量”,李飞飞产生了一个疯狂的想法。
她拿出一本字典,决定要让图像识别涵盖到字典里的每一个词条。
李飞飞与导师
当她把这个想法告诉其他教授时,大家都纷纷劝她换个方向,因为研究这个是“拿不到终生教授”的。
她还找了好几个教授想要寻求合作,也全然被拒绝了,都认为“看不到结果”,“不值得”。
但是李飞飞却没有想那么多,先别管“终生教授”的事,首先要做好自己认为重要的事情。
李飞飞在斯坦福大学授课
刚开始时,李飞飞将很大部分的精力都放在算法的优化上,然而这并没有带来太大的突破。
突然有一天,一个非常简单但却非常有冲击力的想法,使李飞飞找准了方法。
她想,没人教婴儿怎么“看”,也没有人告诉他们“猫”的特征。
但是他们却能够很快的知道这就是猫,无论什么品种或什么形态。
因为人类的眼睛就好像一个生物照相机,每200毫秒就能获取一幅图片。
一个三岁的孩子就已经见过上亿副图片了,能分辨图片当然不在话下。
所以要让计算机学会“识图”,关键是在于训练量——让计算机看更多的图片。
从2007起,李飞飞与团队便从互联网上下载了近10亿幅图片。
在这之后便是对这些图片进行分类、打上标签,为计算机提供学习用的“题库”,而这个“题库”就是现在的ImageNet。
然而,当他们给图片打标签打了几个月后,研究经费很快用完了。
而且按照这个速度,至少得十几年才能完成目标,因为图片实在是太多了。
但李飞飞却从来没想过放弃,在最困难时,她甚至还想重操旧业开洗衣店,为研究筹集经费呢。
正当大家一筹莫展时,他们遇到了美国最大电商平台——亚马逊。
当然不是在上面买书,而是和亚马逊的众包平台合作。
通过众包平台,李飞飞在网上雇佣到了来自167个国家的5万人,为这十亿张备选图片筛选、排序、打标签。
当时的李飞飞,一度是这个众包平台上最大雇主。
到2009年,ImageNet数据库就包含了1500万张照片,涵盖了20000多种物品。
回想在2006年那4到20种物品,ImageNet数据库无论在质量还是数量上,都是空前的。
然而,最重要的是,ImageNet这个如此庞大的图片数据库竟然是免费的。
这就意味着,全球所有致力于计算机视觉识别的团队,都能从这个题库里面拿“试题”,来测试自家算法的准确率。
ImageNet挑战赛的机器错误率, 七年来从28%降到了3.6% ,比人眼识别的错误率5.1%还要低。
为了激发各界对计算机视觉研究的热情,李飞飞每年都会举行一场ImageNet视觉识别挑战赛。
在这场考试中,无论挑战者的输与赢都代表着一次新的发展。
如果考生能轻易答对“试题”,这就说明了视觉识别技术的更上一层楼。
但如果“试题”难倒了考生,也不用担心,这也意味着算法的突破口就在这。
不过,对于现在一度“过热”的人工智能,李飞飞也一直在强调“人工智能现在越火,越需要有冷静做研究的人”
她说“我做研究的心得就是,眼睛看到的前方应该是比较空旷的。如果你眼睛看到的前方是热闹的,那这个方向就不是最好的研究方向。而空旷的地方一般都不是热点,因此你必须找准自己的焦点”
李飞飞首度亮相谷歌云大会
关于未来的AI开发,李飞飞认为不但要在学术上还要结合工业上的开发。
因为AI的最终目的就是服务于人类,这也是李飞飞加入谷歌的原因。
为的就是拉近AI与人类日常生活的距离,使AI"更接地气"。
谷歌街景搜集的车辆数据
在今年2月末,李飞飞又发表了最新的论文:《用深度学习和谷歌街景估算美国人口结构》。
文章主要论述了如何将谷歌街景搜集来的机动车辆数据,结合机器学习算法。
从而估算出本地区人口的特征和组成,甚至这一地区居民的政治倾向。
在李飞飞看来,目前的图像识别和人工智能,还相当于一个牙牙学语的3岁孩童。
而3岁到10岁的过程,才是人工智能的难点和关键。
就算李飞飞说图像识别的路还有很远,但也完全不妨碍我们畅想未来。
去超市买东西,直接“刷脸”付款;
在追击违法分子上,可能罪犯刚一上街就已经被一双神秘的眼睛锁定;
完全不用看红绿灯的“未来式过马路”
在未来交通上,人们不用自己抓方向盘,也有“老司机”带你飞;
在医疗上,医生和护士会多了一双永远不用休息的眼睛,帮忙诊断和照顾病人;
在TED演讲的结尾,李飞飞表示:
她现在所有的追求,就是赋予计算机视觉智能, 并为Leo(她的儿子)和这个世界, 创造出更美好的未来。
这个集才华与美貌于一身的女子,能把人类带到哪个未知领域,我们也翘首以待。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 06:29
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社