博文

魔豆和袋塔的故事

已有 3250 次阅读 2016-3-14 10:33 |个人分类:科研与教学|系统分类:科研笔记| 数据, 模型, 质量控制

导读：亲爱的朋友，看了标题，您千万不要以为本文讲的是神奇的植物和动物，其实……

魔豆即model，模型也；袋塔即data，数据也。做模型的人常常宣称自己模拟得多么多么准，而做实验观测的人总说自己测的数据有多少误差，给一班懵懂无知的学生留下的印象就是模型比实验观测要准。其实，除非仪器或方法有问题，实验观测再不准也比模型要准，因为模型也是靠实验数据校准的，它还能比校验的标准还准吗？

做模型的关键是要有好的数据，光有的好想法没好的数据，再精通模型也没用。与本课题组合作过的一位加拿大华人教授说过，做模型的人有一半时间要花在数据上。当时我有些不解，做模型的人一般自己不做实验，但搜集数据也不至于要花那么多时间吧？后来我才明白，搜集数据花的时间虽多，但更多的时间要花在判别数据的可靠性上。如果用不可靠的数据校验模型或作为模型的输入，只有越搞越糟。

而判别数据的可靠性，除了需要相关专业的背景知识，也需要有实际观测的经验。所以我赞同一位澳洲华人教授的观点，就是硕士阶段以实验观测为主，博士阶段以做模型为主。学生有了实际观测的经验，用过有关仪器，知道数据是怎么来的，做模型的时候就不会拿来数据就用，出现用错数据闹笑话的情况了。

如何判断数据的可靠性？举个例子：比如判断气象数据的可靠性，可以先画图，按年画，一年一张。如果小时尺度数据量太大，不好看规律，可以转为日尺度再画。一般温、湿度都有明显的日变化和季节变化。辐射由于晴天、阴天差别，日值波动很大，但一年之中的季节变化规律还是挺明显的。最不好判别的是风速，没有明显的日变化和季节变化规律。我的经验是，先将超出仪器观测范围的数据剔除，如果有多层（冠层以上4层或更多）数据，可按对数分布廓线剔除不好的数据。因为工作量较大，手动剔除数据耗时多，且容易主观，最好编程处理。温度、湿度数据如果有多层的也可相互对照，去除某层与其它层明显不符的数据。以上针对的是自行观测的未经质量控制的气象数据，如果是国家气象台站（NWO）的观测数据，都是经过专业人士质量控制的，如果对数据要求不是特别苛刻的话，大可放心去用。

转载本文请联系原作者获取授权，同时请注明本文来自李俊科学网博客。
链接地址：https://blog.sciencenet.cn/blog-440967-962524.html

上一篇：韦小宝成功的秘诀（二）
下一篇：芝兰玉树

收藏 IP: 114.246.101.*| 热度|

当前推荐数：1 推荐人：尤明庆

该博文允许注册用户评论请点击登录评论 (5 个评论)

数据加载中...

返回顶部

李俊

扫一扫，分享此博文

背着房子去旅行分享 http://blog.sciencenet.cn/u/unesco 黎明镜中的远航烟云缭绕一曲清歌引我云游四方

博文

魔豆和袋塔的故事

当前推荐数：1 推荐人：尤明庆

该博文允许注册用户评论请点击登录评论 (5 个评论)

李俊

全部作者的其他最新博文

全部精选博文导读

相关博文

背着房子去旅行分享 http://blog.sciencenet.cn/u/unesco 黎明 镜中的远航 烟云缭绕 一曲清歌引我 云游四方

博文

魔豆和袋塔的故事

当前推荐数：1 推荐人： 尤明庆

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

李俊

全部作者的其他最新博文

全部精选博文导读

相关博文

背着房子去旅行分享 http://blog.sciencenet.cn/u/unesco 黎明镜中的远航烟云缭绕一曲清歌引我云游四方

当前推荐数：1 推荐人：尤明庆

该博文允许注册用户评论请点击登录评论 (5 个评论)