背着房子去旅行分享 http://blog.sciencenet.cn/u/unesco 黎明 镜中的远航 烟云缭绕 一曲清歌引我 云游四方

博文

魔豆和袋塔的故事

已有 3110 次阅读 2016-3-14 10:33 |个人分类:科研与教学|系统分类:科研笔记| 数据, 模型, 质量控制

导读:亲爱的朋友,看了标题,您千万不要以为本文讲的是神奇的植物和动物,其实……

魔豆即model,模型也;袋塔即data,数据也。做模型的人常常宣称自己模拟得多么多么准,而做实验观测的人总说自己测的数据有多少误差,给一班懵懂无知的学生留下的印象就是模型比实验观测要准。其实,除非仪器或方法有问题,实验观测再不准也比模型要准,因为模型也是靠实验数据校准的,它还能比校验的标准还准吗?

做模型的关键是要有好的数据,光有的好想法没好的数据,再精通模型也没用。与本课题组合作过的一位加拿大华人教授说过,做模型的人有一半时间要花在数据上。当时我有些不解,做模型的人一般自己不做实验,但搜集数据也不至于要花那么多时间吧?后来我才明白,搜集数据花的时间虽多,但更多的时间要花在判别数据的可靠性上。如果用不可靠的数据校验模型或作为模型的输入,只有越搞越糟。

而判别数据的可靠性,除了需要相关专业的背景知识,也需要有实际观测的经验。所以我赞同一位澳洲华人教授的观点,就是硕士阶段以实验观测为主,博士阶段以做模型为主。学生有了实际观测的经验,用过有关仪器,知道数据是怎么来的,做模型的时候就不会拿来数据就用,出现用错数据闹笑话的情况了。

如何判断数据的可靠性?举个例子:比如判断气象数据的可靠性,可以先画图,按年画,一年一张。如果小时尺度数据量太大,不好看规律,可以转为日尺度再画。一般温、湿度都有明显的日变化和季节变化。辐射由于晴天、阴天差别,日值波动很大,但一年之中的季节变化规律还是挺明显的。最不好判别的是风速,没有明显的日变化和季节变化规律。我的经验是,先将超出仪器观测范围的数据剔除,如果有多层(冠层以上4层或更多)数据,可按对数分布廓线剔除不好的数据。因为工作量较大,手动剔除数据耗时多,且容易主观,最好编程处理。温度、湿度数据如果有多层的也可相互对照,去除某层与其它层明显不符的数据。以上针对的是自行观测的未经质量控制的气象数据,如果是国家气象台站(NWO)的观测数据,都是经过专业人士质量控制的,如果对数据要求不是特别苛刻的话,大可放心去用。



https://blog.sciencenet.cn/blog-440967-962524.html

上一篇:韦小宝成功的秘诀(二)
下一篇:芝兰玉树
收藏 IP: 114.246.101.*| 热度|

1 尤明庆

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-18 13:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部