博文

AI助力大气科学：站点数据处理、WRF后处理、再分析数据统计分析、偏差校正、趋势突变检验及晴雨分类等

已有 1069 次阅读 2026-4-28 09:30 |系统分类:科研笔记

你是否还在为处理海量气象数据而头疼？是否还在手动写代码、查文献、调参数？本次内容将彻底改变你的科研方式。系统性地将GPT等大语言模型与Python气象分析全流程深度结合，覆盖从数据获取、预处理、统计分析到可视化与建模的每一个环节。无论你是处理PERSIANN/GSMaP遥感降水数据，还是分析ERA5再分析资料，亦或是进行WRF后处理与CMIP6未来气候模拟，AI都将成为你最得力的科研助手。

涵盖专题包括：AI工具与提示词工程、科研辅助（文献综述、翻译、摘要生成）、高级可视化（风玫瑰图、流线图、泰勒图）、站点数据处理（缺失值填充、孤立森林异常检测、MK/Pettitt/SNHT突变检验、小波/EMD周期分析）、WRF模型支持、遥感降水评估（泰勒图、密度图）、干旱监测与极端指数计算、风能与太阳能资源评估，以及基于机器学习的天气晴雨分类（堆叠模型、SHAP解释）等。

专题一预备知识

1.AI领域常见工具模型

2.POE平台及ChatGPT使用方法

3.提示词工程介绍、提示词常见模板

4.Python基本语法 Numpy使用、Pandas使用、Xarray使用、Matplotlib使用

专题二科研辅助专题

1.GPT作为科研工具：搜索引擎、翻译软件、润色工具、提取整理文章数据、数据处理

2.作为科研助手生成

3.作为辅助工具下载数据：PERSIANN /GSMaP数据；GSOD数据；NCEP/NCAR再分析数据；GFS预报数据

专题三可视化专题

1.绘制常见统计图

2.绘制风场图、风羽图、风矢图、流线图、双Y轴、风玫瑰图、填充图、添加子图、期刊常见图

专题四站点数据处理

1.读取多种来源原始数据（ISD、GSDO）

2.缺失值处理

3.数据质量控制

基于统计阈值的异常检测

基于机器学习的异常检测（Isolation Forest等方法）

多变量数据的异常检测（服务于自动气象站数据）

基于时间序列方法均一化检验（服务于长时间气候变化评估）

4.时间序列的趋势：移动平均法、分解法（STL, Seasonal and Trend decomposition using loess）、Sen’s斜率

5.时间序列的突变检验

MK (Mann-Kendall): Mann-Kendall趋势检验（用于分析数据集中的趋势变化）

Pettitt: Pettitt检验（非参数检验方法，用于检测时间序列中的单一变化点）

BUT (Buishand U Test): Buishand U型统计检验

SNHT (Standard Normal Homogeneity Test): 标准正态同质性检验（常用于气候数据的同质性检测）

BG (Buishand Range Test): Buishand范围检验

6.时间序列周期分析

功率谱方法提取周期（提取气温、降水等周期）

小波分析方法提取周期

EMD经验模态分解

EEMD集成经验模态分解

7.不同时间尺度上的统计

8.回归分析

线性回归（Linear Regression）:简单线性回归、多元线性回归等

多项式回归（Polynomial Regression）

非参数回归（Non-parametric Regression）

9.相关分析

常见的相关系数（Pearson Correlation Coefficient、Spearman's Rank Correlation Coefficient）

偏相关分析（Partial Correlation）

典型相关分析（Canonical Correlation Analysis, CCA）

10.站点数据的空间化：克里格插值、临近点插值、反距插值、基于高程模型的外推

专题五 WRF专题

1.使用Python生成WPS的静态数据

2.生成WRF配置文件

3.WRF的后处理：站点插值、能见度计算、垂直高度变量插值、降水相态辨识、水汽通量

4.WRF的评估：格点尺度评估、点尺度评估、模态评估

专题六遥感降水

1.将PERSSIAN/GSMaP数据转化为netCDF格式

2.合并数据

3.时间域统计并可视化

4.空间域统计并可视化

5.常见统计评估指标：生成统计指标空间图、泰勒图、卫星降雨散点密度图

专题七再分析数据

1.ERA5再分析数据下载、预处理、多时间尺度统计、干旱监测、极端指数计算、趋势分析

2.多套再分析数据的气候趋势分析：对比NCEP/NCAR、ERA5、CRU等均值

3.风能资源评估

4.太阳能资源评估

专题八 CMIP6未来气候

1.数据预处理：使用NetCDF工具（xarray）读取数据；裁剪时间范围和空间范围

2.计算区域平均温度：对于全球平均温度加权平均；对于特定区域，直接计算平均值

3.趋势分析：使用统计方法（如线性回归）分析温度随时间的变化趋势

4.可视化：绘制时间序列图显示温度趋势；使用地图可视化工具（basemap）展示空间分布的变化

专题九基于机器学习方法判断天气晴雨

1.预处理：缺失值处理；数据探索；数据标准化/归一化；数据类型转换

2.数据采样：均衡采样；分层抽样；交叉验证分割；时间序列分割

3.特征工程：特征选择；降维；多项式特征

4.模型建模与堆叠：单模型训练如决策树、SVM、随机森林；模型堆叠；调参；集成学习

5.模型评估：性能指标根据问题类型（分类或回归）选择合适的评估指标，如准确度、召回率、F1分数、AUC值、均方误差；模型解释性：使用SHAP对模型的预测进行解释，提高模型的可解释性

推荐：WRF模拟全技术链实践暨Linux编译排错、FNL/ERA5驱动场处理、长时序模拟配置、下垫面改造与物理参数调整、Python诊断分析及可视化

WRF（Weather Research and Forecasting Model）作为当下大气科学、环境科学及水文地理领域应用广泛的中尺度气象模式，是相关科研人员开展数值模拟、机理分析、场景预测的“核心工具”——小到局地暴雨、台风过程的精细模拟，大到区域气候演变、土地利用/城市化的气象效应研究，WRF都是产出高质量成果的“标配利器”。

但对于多数研究者而言，WRF的学习门槛却如同“陡峭的悬崖”：复杂的Linux环境编译常卡在依赖库配置，晦涩的物理参数（微物理、边界层方案）选不准会导致模拟结果“偏离实际”，枯燥的数据预处理（驱动场、静态地理数据）耗费大量时间却难保证质量，更不用说如何设计符合科研标准的敏感性试验（如下垫面改造、参数调整）—— 这些痛点往往让初学者“望而却步”，也让有基础的研究者卡在“只会跑默认案例，无法满足个性化研究需求”的瓶颈。

完成本内容，您能够：

①独立部署（搭建“天气实验室”）：在Linux系统上独立完成WRF及WPS全套环境的编译与安装

②熟练预处理：精通WPS流程，掌握网格设计、静态数据配置及GFS/FNL等不同驱动场的处理

③运行真实案例：独立配置并成功模拟一次完整的天气过程（如台风、暴雨事件）

④掌握数据挖掘：使用Python (wrf-python) 对wrfout结果进行专业的气象诊断分析

⑤专业可视化（制作专业天气图）：使用Python (matplotlib/cartopy) 绘制可用于报告和论文的天气图（温度、降水、风场等）

⑥理解核心物理：深入理解关键物理过程（如微物理、边界层）的选择对模拟结果的影响

关注【科研充电吧】公众号，获取海量教程和资源

转载本文请联系原作者获取授权，同时请注明本文来自王艳科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3539141-1532499.html

上一篇：Copula与VineCopula、Copula回归、Copula贝叶斯网络、贝叶斯先验估计
下一篇：AI支持下的水科学全景解析：暨AI在水文水资源、水环境科研与工程领域中的全方位实践

欢迎参加科学网十佳博文评选活动！

主办单位：