||
昨天阅读Nature和GRL,写作“科学观测也拥抱“众包”革命:用智能手机跟踪气候”一文。有网友评价担心其代表性误差太大,其实这也是我的担心。尽管文中也用很多的篇幅论述了如何减少这些误差,但总还是觉得说服力不太强。这篇博文发出不久,一中文杂志编辑联系我,说能否将这篇博文的内容整理一下发在他们刊物。我答应了,但要做一些功课。于是,今天几乎花了一天的时间来寻找更多的资料,试图弄清这个疑问,并整理文章。在查阅资料中,OpenSignal网站一篇博文正好谈论了GRL论文写作背后的故事。那么,今天我的这篇博文就是结合OpenSignal网站的文字和我的想法写作出来的。
说起来,这个研究也属偶然。刚开始,他们所发布的OpenSignal应用,只是想绘制世界无线网络分布图供用户使用。智能手机中都会有锂电池,为了防止锂电池在充电时过热,会同时安装一个温度传感器。为了绘制这个地图,也需要测试电池的性能,包括电荷水平、电压和电池温度等指标。一般在信号弱的地方,电池消耗会增加,温度就会略微上升。经过6个月的数据收集,他们得到了一个意想不到的结果:这些大量的电池温度的读数居然与这个城市历史上户外气温数据有很强的相关性。当时与OpenSignal合作的Aart Overeem博士,正在研究如何利用手机基站来测量降雨。当Aart Overeem博士看到这个结果,觉得非常有趣,于是就一起来探讨这个问题。去年这个时候,他们已经从15万个Android设备中获得了4000万个电池温度读数 。一时兴起,他们从Weather Underground网站(Wunderground.com)获得了伦敦的气温数据。除少数点异常高和低的数据被排除外,大多数数据都保留了数据原始。下图就显示了二者之间的关系。
简单的分析发现,如果通过一个数学变换,就可以用一组手机的电池平均温度来代表室外气温。这个发现很有意思,他们又继续研究了洛杉矶、巴黎、墨西哥、罗马等地的手机电池温度与当地气温之间的关系,通过这些数据再次验证了这一关系的正确性。因此,他们信心满满地开发了一个应用程序WeatherSignal,主要就是利用这个温度传感器来测量温度。后来,在MIT的Berthold Horn帮助下,完成了一篇科学论文投稿到GRL中,就是我昨天所讨论的那篇文章。
电池的温度取决于几个因素:是在室内、户外还是口袋中,使用的强度如何,其本身的功效如何。在做出上面这张图之前,他们并没有试图纠正这些因素。然而,透过这些噪声数据,他们却获得了信号:外部环境气温。这个图展示了电池温度和伦敦气温之间很强的线性相关性(皮尔森系数为0.82),线性相关就意味着通过一个线性变换就可以将数据进行相互转换。这两条线的变化是非常一致的,平均绝对差值为1.45°C,在此期间处于14°C上下波动。另外,气象站只是固定在同一个地方,而这里收集的数据了几乎覆盖全伦敦,所以出现一些差异是可解释为在不同地方的测量所致的。
当然,类似的方法用于其他8个城市也同样产生了很好的结果,而且发现每跨两个不同的季节,平均绝对误差为1.52°C。
注意,这里气象站数据对洛杉矶(LA)7月4日的记录是不正确的,而Android设备所收集的数据实际上更可靠一些。
如上所述,这个线性变化是很简单的:
伦敦公式:Te= 2.55*Tc – 60.52
通用公式:Te= mTc + k(线性变换的通式)
(Te 指外界气温,Tc 指手机电池温度)
要将手机电池温度转化为室外温度,要考虑两件事儿。首先要将数据乘上m(对伦敦来说,这个值是2.55)进行拉伸,然后添加一个常数k(-60.522)。这里,通过一个特例来体会一下为什么这个公式是有道理的。想象一部手机被用户放在口袋中来到室外,用户和电池都会产生一定的热量。对于这款手机,我们能说的两件事是:1)电池温度会抵消一些室外的温度。人的皮肤温度一般比环境温度要高一些,电池内产生的热会进一步提高温度。这说明了一个情况,那就是需要减去一些量,如这里的k。2)唯一能改变电池温度的是环境温度的变化。但是注意,环境温度变化1度,电池温度的变化会小于1度。人类穿着的衣物也是热的不良导体,而且电池自身持续的产热过程也会减弱外部温度变化的影响,所以我们需要乘上m。但是,用户并不总是在外面,手机也并不总是在他们口袋中,无论是人的身体还是电池本身都不会产生恒定的热量。不过没有关系,因为这个公式本来用于单个用户就是问题多多的。
再考虑收集多个用户数据的情况。虽然对于每部电话和用户来说,电池和身体所产生的热量是变化的,但当对多部电话和多名用户进行平均后,这些值就趋近于常数值。Berthold Horn设计了一个通用热流模型,显示了为什么当将许多用户的值进行平均后,这个简单的公式就可以用了。事情比这更加微妙的是,“常量”k和m是依赖环境温度的隐形变量。例如,在下雨的时候,人们一般乐意呆在房间,当天气晴好时,更多人会选择呆在室外。这些行为无疑会影响m和k值,也就是说这些值必须随着时间和空间的变化进行调节。有趣的是,m和k似乎在一段时间内是趋向稳定的。
这一发现恰好证明了他们在OpenSignal中的方法是有效的:从大量的噪音数据中,有价值的信息可以提炼出来的。这也从一个侧面证明了大数据方法的威力:更多的数据可以锤炼出整洁的数据(more data can beat cleaner data)。
无独有偶,美国科学家正在开展的近地面气象识别(meteorological Phenomena Identification Near the Ground,mPING)也是一个通过公众的智能手机或移动设备收集天气信息的研究项目。项目的研究人员开发了一个移动应用程序mPING供大家免费下载和使用。用户通过mPING可以选择当前的天气类型并提交报告,而用户的位置和时间则会自动包含在报告中。无论是过去还是实时的报告,都储存在mPING数据库中,并根据时间和位置进行了整理,任何人随时可查看这些观测数据,甚至可用于判定你的身边是否会发生灾害性的天气,以便早做准备。当然,在服务器端和后台,研究人员还将对数据做进一步分析,例如将这些报告与雷达探测数据进行比较,并采用这些信息来开发新的监测雷达和预报技术。当然,这个项目目前涉及的范围只是针对美国本土的。
一些新型智能手机,正在整合越来越多的传感器,但通常这些传感器并不是为测量气象指标而添加的,比如,手机上安装的气压计一般是用来修正GPS所获得的海拔高度的,而光传感器是用来自动调节屏幕亮度的,这正如与电池温度计不是用来测气温的一样。我们现在只是在扩展这些传感器的用途。或许,已经产生的很多数据都可以通过互联网来进行交流,综合起来就可以对我们的生活和环境提供更有意义的数据。
当然,为了获得专门的气象指标的测定,也有专门为智能手机开发的传感器。例如,荷兰的iSPEX就是这样一个智能手机的扩展设备。安装这套设备和应用后,手机立刻就变成了一个科学仪器,可用于测量大气中的气溶胶。这个设备的设计借鉴了行星探测的分光偏振计(SPEX)的原理,因为是iPhone的应用,所以被称为iSPEX。手机上连接这个设备后,只需要对着蓝天拍摄一张照片,就这么简单!数据就会自动上传送到中央数据库。数据库服务器结合所有的测量结果和专业监测站的数据,就能生产一个大范围的气溶胶分布图。大气出现污染后,对每个人来说可能都无法逃避。通过这种方式,每个人都能尽自己的一份力量,有助于尽早解决问题。尽管大家都不太意识到气溶胶的存在,但其实它对人们的生活是有巨大影响的。细小的颗粒物会影响我们的健康,大气能见度差的时候飞机不能起飞,甚至可能形成我们目前未知的大的气候变化问题。利用iSPEX所收集的数据,可帮助人们更好地评估细颗粒物带来的健康风险,也有助于理解大气气溶胶和气候变化之间的关系。
手机传感器对个人未来所带来的革命也可能是翻天覆地的。例如,它可以让用户的个人手机变成类似于飞行黑匣子的记录器。想象一下,为你看病的医生,如果获得授权后,可以访问你手机上“个人健康黑匣子”所上载的数据,就可以知道你曾经在哪些国家呆过,曾经经历了何种极端的气压和温度环境,你平时的运动量是多少,甚至你居住环境的湿度是多少,这些数据对于医生的正确诊断该有多重要呀!总之,智能手机传感器网络已经为即将实现的气象学和医学的重大变革准备就绪。
参考资料:
[1] http://opensignal.com/reports/battery-temperature-weather/
[2] http://www.nssl.noaa.gov/projects/ping/
[3] http://ispex.nl/en/
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-28 12:47
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社