|
你是否还在为处理海量气象数据而头疼?是否还在手动写代码、查文献、调参数? 本次内容将彻底改变你的科研方式。系统性地将GPT等大语言模型与Python气象分析全流程深度结合,覆盖从数据获取、预处理、统计分析到可视化与建模的每一个环节。无论你是处理PERSIANN/GSMaP遥感降水数据,还是分析ERA5再分析资料,亦或是进行WRF后处理与CMIP6未来气候模拟,AI都将成为你最得力的科研助手。
涵盖专题包括:AI工具与提示词工程、科研辅助(文献综述、翻译、摘要生成)、高级可视化(风玫瑰图、流线图、泰勒图)、站点数据处理(缺失值填充、孤立森林异常检测、MK/Pettitt/SNHT突变检验、小波/EMD周期分析)、WRF模型支持、遥感降水评估(泰勒图、密度图)、干旱监测与极端指数计算、风能与太阳能资源评估,以及基于机器学习的天气晴雨分类(堆叠模型、SHAP解释)等。
专题一 预备知识
1.AI领域常见工具模型
2.POE平台及ChatGPT使用方法
3.提示词工程介绍、提示词常见模板
4.Python基本语法 Numpy使用、Pandas使用、Xarray使用、Matplotlib使用
专题二 科研辅助专题
1.GPT作为科研工具:搜索引擎、翻译软件、润色工具、提取整理文章数据、数据处理
2.作为科研助手生成
3.作为辅助工具下载数据:PERSIANN /GSMaP数据;GSOD数据;NCEP/NCAR再分析数据;GFS预报数据
专题三 可视化专题
1.绘制常见统计图
2.绘制风场图、风羽图、风矢图、流线图、双Y轴、风玫瑰图、填充图、添加子图、期刊常见图
专题四 站点数据处理
1.读取多种来源原始数据(ISD、GSDO)
2.缺失值处理
3.数据质量控制
基于统计阈值的异常检测
基于机器学习的异常检测(Isolation Forest等方法)
多变量数据的异常检测(服务于自动气象站数据)
基于时间序列方法均一化检验(服务于长时间气候变化评估)
4.时间序列的趋势:移动平均法、分解法(STL, Seasonal and Trend decomposition using loess)、Sen’s斜率
5.时间序列的突变检验
MK (Mann-Kendall): Mann-Kendall趋势检验(用于分析数据集中的趋势变化)
Pettitt: Pettitt检验(非参数检验方法,用于检测时间序列中的单一变化点)
BUT (Buishand U Test): Buishand U型统计检验
SNHT (Standard Normal Homogeneity Test): 标准正态同质性检验(常用于气候数据的同质性检测)
BG (Buishand Range Test): Buishand范围检验
6.时间序列周期分析
功率谱方法提取周期(提取气温、降水等周期)
小波分析方法提取周期
EMD经验模态分解
EEMD集成经验模态分解
7.不同时间尺度上的统计
8.回归分析
线性回归(Linear Regression):简单线性回归、多元线性回归等
多项式回归(Polynomial Regression)
非参数回归(Non-parametric Regression)
9.相关分析
常见的相关系数(Pearson Correlation Coefficient、Spearman's Rank Correlation Coefficient)
偏相关分析(Partial Correlation)
典型相关分析(Canonical Correlation Analysis, CCA)
10.站点数据的空间化:克里格插值、临近点插值、反距插值、基于高程模型的外推
专题五 WRF专题
1.使用Python生成WPS的静态数据
2.生成WRF配置文件
3.WRF的后处理:站点插值、能见度计算、垂直高度变量插值、降水相态辨识、水汽通量
4.WRF的评估:格点尺度评估、点尺度评估、模态评估
专题六 遥感降水
1.将PERSSIAN/GSMaP数据转化为netCDF格式
2.合并数据
3.时间域统计并可视化
4.空间域统计并可视化
5.常见统计评估指标:生成统计指标空间图、泰勒图、卫星降雨散点密度图
专题七 再分析数据
1.ERA5再分析数据下载、预处理、多时间尺度统计、干旱监测、极端指数计算、趋势分析
2.多套再分析数据的气候趋势分析:对比NCEP/NCAR、ERA5、CRU等均值
3.风能资源评估
4.太阳能资源评估
专题八 CMIP6未来气候
1.数据预处理:使用NetCDF工具(xarray)读取数据;裁剪时间范围和空间范围
2.计算区域平均温度:对于全球平均温度加权平均;对于特定区域,直接计算平均值
3.趋势分析:使用统计方法(如线性回归)分析温度随时间的变化趋势
4.可视化:绘制时间序列图显示温度趋势;使用地图可视化工具(basemap)展示空间分布的变化
专题九 基于机器学习方法判断天气晴雨
1.预处理:缺失值处理;数据探索;数据标准化/归一化;数据类型转换
2.数据采样:均衡采样;分层抽样;交叉验证分割;时间序列分割
3.特征工程:特征选择;降维;多项式特征
4.模型建模与堆叠:单模型训练如决策树、SVM、随机森林;模型堆叠;调参;集成学习
5.模型评估:性能指标根据问题类型(分类或回归)选择合适的评估指标,如准确度、召回率、F1分数、AUC值、均方误差;模型解释性:使用SHAP对模型的预测进行解释,提高模型的可解释性
推荐:WRF模拟全技术链实践暨Linux编译排错、FNL/ERA5驱动场处理、长时序模拟配置、下垫面改造与物理参数调整、Python诊断分析及可视化
WRF(Weather Research and Forecasting Model)作为当下大气科学、环境科学及水文地理领域应用广泛的中尺度气象模式,是相关科研人员开展数值模拟、机理分析、场景预测的“核心工具”——小到局地暴雨、台风过程的精细模拟,大到区域气候演变、土地利用/城市化的气象效应研究,WRF都是产出高质量成果的“标配利器”。
但对于多数研究者而言,WRF的学习门槛却如同“陡峭的悬崖”:复杂的Linux环境编译常卡在依赖库配置,晦涩的物理参数(微物理、边界层方案)选不准会导致模拟结果“偏离实际”,枯燥的数据预处理(驱动场、静态地理数据)耗费大量时间却难保证质量,更不用说如何设计符合科研标准的敏感性试验(如下垫面改造、参数调整)—— 这些痛点往往让初学者“望而却步”,也让有基础的研究者卡在“只会跑默认案例,无法满足个性化研究需求”的瓶颈。
完成本内容,您能够:
①独立部署(搭建“天气实验室”):在Linux系统上独立完成WRF及WPS全套环境的编译与安装
②熟练预处理:精通WPS流程,掌握网格设计、静态数据配置及GFS/FNL等不同驱动场的处理
③运行真实案例:独立配置并成功模拟一次完整的天气过程(如台风、暴雨事件)
④掌握数据挖掘:使用Python (wrf-python) 对wrfout结果进行专业的气象诊断分析
⑤专业可视化(制作专业天气图):使用Python (matplotlib/cartopy) 绘制可用于报告和论文的天气图(温度、降水、风场等)
⑥理解核心物理:深入理解关键物理过程(如微物理、边界层)的选择对模拟结果的影响
关 注【科研充电吧】公 众 号,获取海量教程和资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-29 00:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社