wangyanjiayou的个人博客分享 http://blog.sciencenet.cn/u/wangyanjiayou

博文

AI助力大气科学:站点数据处理、WRF后处理、再分析数据统计分析、偏差校正、趋势突变检验及晴雨分类等

已有 201 次阅读 2026-4-28 09:30 |系统分类:科研笔记

你是否还在为处理海量气象数据而头疼?是否还在手动写代码、查文献、调参数? 本次内容将彻底改变你的科研方式。系统性地将GPT等大语言模型与Python气象分析全流程深度结合,覆盖从数据获取、预处理、统计分析到可视化与建模的每一个环节。无论你是处理PERSIANN/GSMaP遥感降水数据,还是分析ERA5再分析资料,亦或是进行WRF后处理与CMIP6未来气候模拟,AI都将成为你最得力的科研助手。

涵盖专题包括:AI工具与提示词工程、科研辅助(文献综述、翻译、摘要生成)、高级可视化(风玫瑰图、流线图、泰勒图)、站点数据处理(缺失值填充、孤立森林异常检测、MK/Pettitt/SNHT突变检验、小波/EMD周期分析)、WRF模型支持、遥感降水评估(泰勒图、密度图)、干旱监测与极端指数计算、风能与太阳能资源评估,以及基于机器学习的天气晴雨分类(堆叠模型、SHAP解释)等。

专题一 预备知识

1.AI领域常见工具模型

2.POE平台及ChatGPT使用方法

3.提示词工程介绍、提示词常见模板

4.Python基本语法 Numpy使用、Pandas使用、Xarray使用、Matplotlib使用

专题二 科研辅助专题

1.GPT作为科研工具:搜索引擎、翻译软件、润色工具、提取整理文章数据、数据处理

2.作为科研助手生成

3.作为辅助工具下载数据:PERSIANN /GSMaP数据;GSOD数据;NCEP/NCAR再分析数据;GFS预报数据

专题三 可视化专题

1.绘制常见统计图

2.绘制风场图、风羽图、风矢图、流线图、双Y轴、风玫瑰图、填充图、添加子图、期刊常见图

专题四 站点数据处理

1.读取多种来源原始数据(ISD、GSDO)

2.缺失值处理

3.数据质量控制

基于统计阈值的异常检测

基于机器学习的异常检测(Isolation Forest等方法)

多变量数据的异常检测(服务于自动气象站数据)

基于时间序列方法均一化检验(服务于长时间气候变化评估)

4.时间序列的趋势:移动平均法、分解法(STL, Seasonal and Trend decomposition using loess)、Sen’s斜率

5.时间序列的突变检验

MK (Mann-Kendall): Mann-Kendall趋势检验(用于分析数据集中的趋势变化)

Pettitt: Pettitt检验(非参数检验方法,用于检测时间序列中的单一变化点)

BUT (Buishand U Test): Buishand U型统计检验

SNHT (Standard Normal Homogeneity Test): 标准正态同质性检验(常用于气候数据的同质性检测)

BG (Buishand Range Test): Buishand范围检验

6.时间序列周期分析

功率谱方法提取周期(提取气温、降水等周期)

小波分析方法提取周期

EMD经验模态分解

EEMD集成经验模态分解

7.不同时间尺度上的统计

8.回归分析

线性回归(Linear Regression):简单线性回归、多元线性回归等

多项式回归(Polynomial Regression)

非参数回归(Non-parametric Regression)

9.相关分析

常见的相关系数(Pearson Correlation Coefficient、Spearman's Rank Correlation Coefficient)

偏相关分析(Partial Correlation)

典型相关分析(Canonical Correlation Analysis, CCA)

10.站点数据的空间化:克里格插值、临近点插值、反距插值、基于高程模型的外推

专题五 WRF专题

1.使用Python生成WPS的静态数据

2.生成WRF配置文件

3.WRF的后处理:站点插值、能见度计算、垂直高度变量插值、降水相态辨识、水汽通量

4.WRF的评估:格点尺度评估、点尺度评估、模态评估

专题六 遥感降水

1.将PERSSIAN/GSMaP数据转化为netCDF格式

2.合并数据

3.时间域统计并可视化

4.空间域统计并可视化

5.常见统计评估指标:生成统计指标空间图、泰勒图、卫星降雨散点密度图

专题七 再分析数据

1.ERA5再分析数据下载、预处理、多时间尺度统计、干旱监测、极端指数计算、趋势分析

2.多套再分析数据的气候趋势分析:对比NCEP/NCAR、ERA5、CRU等均值

3.风能资源评估

4.太阳能资源评估

专题八 CMIP6未来气候

1.数据预处理:使用NetCDF工具(xarray)读取数据;裁剪时间范围和空间范围

2.计算区域平均温度:对于全球平均温度加权平均;对于特定区域,直接计算平均值

3.趋势分析:使用统计方法(如线性回归)分析温度随时间的变化趋势

4.可视化:绘制时间序列图显示温度趋势;使用地图可视化工具(basemap)展示空间分布的变化

专题九 基于机器学习方法判断天气晴雨

1.预处理:缺失值处理;数据探索;数据标准化/归一化;数据类型转换

2.数据采样:均衡采样;分层抽样;交叉验证分割;时间序列分割

3.特征工程:特征选择;降维;多项式特征

4.模型建模与堆叠:单模型训练如决策树、SVM、随机森林;模型堆叠;调参;集成学习

5.模型评估:性能指标根据问题类型(分类或回归)选择合适的评估指标,如准确度、召回率、F1分数、AUC值、均方误差;模型解释性:使用SHAP对模型的预测进行解释,提高模型的可解释性

推荐:WRF模拟全技术链实践暨Linux编译排错、FNL/ERA5驱动场处理、长时序模拟配置、下垫面改造与物理参数调整、Python诊断分析及可视化

WRF(Weather Research and Forecasting Model)作为当下大气科学、环境科学及水文地理领域应用广泛的中尺度气象模式,是相关科研人员开展数值模拟、机理分析、场景预测的“核心工具”——小到局地暴雨、台风过程的精细模拟,大到区域气候演变、土地利用/城市化的气象效应研究,WRF都是产出高质量成果的“标配利器”。

但对于多数研究者而言,WRF的学习门槛却如同“陡峭的悬崖”:复杂的Linux环境编译常卡在依赖库配置,晦涩的物理参数(微物理、边界层方案)选不准会导致模拟结果“偏离实际”,枯燥的数据预处理(驱动场、静态地理数据)耗费大量时间却难保证质量,更不用说如何设计符合科研标准的敏感性试验(如下垫面改造、参数调整)—— 这些痛点往往让初学者“望而却步”,也让有基础的研究者卡在“只会跑默认案例,无法满足个性化研究需求”的瓶颈。

完成本内容,您能够:

①独立部署(搭建“天气实验室”):在Linux系统上独立完成WRF及WPS全套环境的编译与安装

②熟练预处理:精通WPS流程,掌握网格设计、静态数据配置及GFS/FNL等不同驱动场的处理

③运行真实案例:独立配置并成功模拟一次完整的天气过程(如台风、暴雨事件)

④掌握数据挖掘:使用Python (wrf-python) 对wrfout结果进行专业的气象诊断分析

⑤专业可视化(制作专业天气图):使用Python (matplotlib/cartopy) 绘制可用于报告和论文的天气图(温度、降水、风场等)

⑥理解核心物理:深入理解关键物理过程(如微物理、边界层)的选择对模拟结果的影响

关 注【科研充电吧】公 众 号,获取海量教程和资源



https://blog.sciencenet.cn/blog-3539141-1532499.html

上一篇:Copula与VineCopula、Copula回归、Copula贝叶斯网络、贝叶斯先验估计
收藏 IP: 111.225.70.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-29 00:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部