闵应骅的博客分享 http://blog.sciencenet.cn/u/ymin 一位IEEE终身Fellow对信息科学及其发展的看法

博文

机器学习卫星图像(171219) 精选

已有 11811 次阅读 2017-12-19 09:09 |个人分类:计算机|系统分类:观点评述| 人工智能, 机器学习, 卫星图像

机器学习卫星图像(171219

闵应骅

在上篇“人工智能与智能科学(171207”中谈到人工智能本质上是一个工程学科,讲究应用。AI下围棋只是为了提高大众对AI的认知程度,并没有实际的用处。IEEE Spectrum 2017/12号上发表一个新闻,就是用机器学习的方法分析卫星图像。这个用处就大了。先看该文提供的几张图片吧!


8张图片,上排自左至右分别是一块墓地、汽车代理商、水坝、电厂;而下排自左到右则是一个工厂、两个医院、一处加油设备。这些图像清晰度都不错,人基本能分辨出来。但是,这么多卫星,每时每刻都在摄像,得产生多少图像数据,成千上万的人也不可能干得过来,必须自动分析。卫星每天获取几十万亿字节的图像。美国情报机构生怕丢失新的核浓缩机构或导弹移动的信息,用人眼的分析显然是不够的。所以,美国情报官员负责启动一个人工智能项目,对卫星图像自动识别需要监视的对象。

今年美国先进研究计划署(IARPA)举办一个竞赛,看什么样的机器学习算法能更准确、更高速地分析卫星图像数据。自从7月以来,竞争者们对全世界最大的卫星数据图像集,包含100万标注的目标,像建筑或设施,训练机器学习算法。数据由美国先进研究计划署(IARPA)提供。10个优胜者将看到他们的AI算法如何对这隐藏的卫星图像数据集而取胜。这个竞争将于12月结束。

IARPA合作者,美国地理空间情报局局长Robert Cardillo要求自动化目前人分析卫星图像工作量的75%。学术界、政府实验室和私人企业有许多团队竞争着这10万美元的奖励,开发深度学习算法,识别特定图像,认知地球图像的有趣目标。这些图像一般来自外国卫星、航空器和无人机的远程传感技术。

卫星图像深度学习算法的分类筛选比人脸、地标、对象的在线识别复杂多了。卫星图像瞬时多角度拍摄,许多对象,例如楼房可能是倒置的,云层的覆盖可能使同一领域这一小时和下一小时不一样。

深度学习算法对于大小固定的图像可以做得很好。但是,卫星图像识别困难得多。譬如它的分辨率变化可能很大,这使深度学习算法复杂化。人类工程师可以有两种选择:一种是重新调整整个图像大小,而丧失某些分辨率;另一种是只收获该图像的某一部分而忽略其他。除此之外,许多卫星可以在远离可见光谱,而在红外或其他波长情况下捕获地球图像。

IARPA竞赛中,原来做卫星图像处理的个人或团队自有自己的优势,但是,他们对实际的卫星图像做深度学习也会碰到大麻烦。专家们相信,即使他们能得到80-90%的精度,完全靠深度学习解决不了整个问题。从美国能源部洛斯阿拉莫斯国家实验室分列出来的笛卡尔实验室CTO Mike Warren 说目前的技术需要人和机器结合才能实际上得到答案。笛卡尔实验室已经为商业目的用深度学习自动分析卫星图像,譬如预报美国玉米和大豆丰收情况。这些应用花10%的努力就可以得到80%的结果。

许多公司开发了深度学习和卫星图像许多有趣的应用,譬如说密苏里大学的一位数据科学家Grant Scort领导另一个团队参加IARPA竞赛。比较而言,美国情报局对于他们的努力和计划基本保持沉默。不过,IARPA竞赛说明这些单位希望为卫星图像分析建造更好的深度学习工具。IARPA项目负责人Hakjac Kim说:美国情报部门已经部署这样的计划和项目,但是,在速度和方法上总有改进的余地。Scort 和他的同事开始展示可用的商用卫星图像与开源智能公开结合的强大威力。在Journal of Applied Remote Sensing杂志的10月号上他们发表的文章说明如何用深度学习算法精确识别中国9万平方公里土地上地对空导弹发射场。有些读者可能会质疑:美国怎么分析我们中国土地?卫星是把地球当作一个整体来看的,我们也可以看美国情况。

他们最好的算法产生的结果用人工检验发现有98%的精确度。该算法用42分钟达到人工分析的精确度,而传统的人工分析平均需要60小时。这些对IARPA竞赛目的的达成是好消息,能够使深度学习成为一个必要的工具。政府和公司会发射更多的图像卫星,去参与了解和地球一样的星座。

美国商业卫星运营商DigitalGlobe提供IARPA竞赛图像,他们每天收集70兆兆字节的原始图像。目前他们急需AI的帮助。

我知道,卫星图像分析牵涉到政治、外交、军事等领域。譬如最近印度媒体拿着卫星图像说“中国或正用秘密隧道将布拉马普特拉河的河水引入沙漠”。这就牵涉到从图像到政治了。技术人员所说的卫星图像分析主要是识别,这是纯粹的技术问题。根据识别,政治家、外交家、军事家可以引申做各种分析,那不是技术问题。如果识别错误,据此来谈政治,那就是无的放矢了。联系到我国的情况,我觉得我们的研究应该更多地根据实际数据,做有实际意义的分析,而不是抽象地空谈一些哲学道理,写几篇SCI论文。我们的卫星图像数据也应该适度放开,扩大允许使用的范围,使更多的研究者加入到图像分析的队伍中来。其实这些卫星图像数据,各国安全部门都可以获得,屏蔽老百姓没什么用。国家机密部门收集了太多的数据,库存起来,而不利用,也是一种浪费,尤其是难免遗漏更加重要的信息。军队的研究适度扩大到地方既可以加强研究力量,提高全国的科研水平,又可以减少国家的双重科研支出。这里所说的“适度”是以不会造成政治、外交、军事影响为准。




https://blog.sciencenet.cn/blog-290937-1090431.html

上一篇:分散化的诱惑(171116)
下一篇:无人机打蚊子(171227)
收藏 IP: 140.240.15.*| 热度|

16 周忠浩 黄永义 徐明昆 汪啸 强涛 周健 许文龙 张明武 杨健华 于国宏 曾宇怀 陆泽橼 彭思龙 杨正瓴 yangb919 dulizhi95

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-1 23:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部