||
模块一:GeoAI数据工程与基础特征构建
一:GeoAI导论与空间数据工程 (Module 1)
1.理论导论:AI遥感与新质生产力
1)定义“新质生产力”在时空遥感大数据领域的体现:新数据、新技术、新决策
2)主流GeoAI应用范式解析(分类、回归、目标检测)
3)空间数据独特性,GeoAI应用范式解析(精准农业、城市规划、灾害应急)
2.公开遥感数据源体系
1)Landsat/Sentinel/高分/高光谱系列数据特性与适用场景
3.【实操】基于Python的自动化数据获取工作流
1)Google Earth Engine (GEE) 平台简介与环境配置
2)掌握geemap与earthengine-api核心库的使用
3)编写函数:实现按研究区范围(ROI)与时间序列的影像检索
4)实现云端计算与本地化数据导出
4.【实操】遥感影像标准化预处理
1)使用GDAL/Rasterio库进行影像读取与写入
2)影像镶嵌与裁剪
3)大气校正的基本原理与实践(以Sentinel-2 L2A产品为例)
二:高价值特征提取与建模样本构建 (Module 2)
1.地面实测数据处理与可视化
1)使用Pandas进行数据读取与清洗
2)使用Matplotlib/Seaborn进行数据分布可视化与正态性检验
2.【实操】空间数据融合:矢量与栅格的精准对齐
1)使用GeoPandas处理矢量数据
2)核心方法:基于地理坐标的像元值提取,构建用于机器学习的“X-y”对齐样本库
3.【实操】特征工程基础
1)常用遥感指数批量计算(NDVI, NDWI等)
2)递归特征消除(Recursive Feature Elimination,RFE)算法原理与scikit-learn实现
模块二:高级特征工程与多模型评估
三:高级特征工程—— 从信号处理与流形学习中挖掘深层特征 (Module 3)
1.高级特征工程导论
1)传统特征工程的局限性(依赖专家知识、难以捕捉深层模式)
2)本专题两大核心思想
信号处理思想:将光谱/时间序列视为信号,分解其不同频率成分。
流形学习思想:假设高维数据实际嵌在一个低维“曲面”上,我们的目标是 “展开”这个曲面。
2.【实操】基于波变换 (Wavelet Transform) 特征提取
1)对于光谱,就是分离出宽缓的背景和尖锐的吸收峰。
2)引入PyWavelets(pywt)核心库。
3)代码演示
a) 使用Numpy生成一条包含多频率成分的模拟光谱信号。
b) 调用pywt进行多级小波分解,得到近似系数(低频)和细节系数(高频)。
c) 核心:讲解如何将这些系数转化为新的机器学习特征(例如,使用各级系数的能量、熵或统计值)。
3.3 【实操】基于流形学习的非线性降维与可视化
1)直观理解:对比PCA(线性降维,像 “拍照片”)与 t-SNE/UMAP(非线性降维,像“铺开一张揉皱的地图”)。
2)引入scikit-learn.manifold.TSNE与umap-learn核心库。
3)代码演示
a) 加载scikit-learn的digits手写数字数据集。
b) 首先使用PCA进行降维可视化,观察效果。
c) 接着使用t-SNE和UMAP进行降维可视化。
d) 强烈对比三种方法的可视化结果,学员会直观地看到t-SNE/UMAP如何更清晰地分离出不同类别的数据簇。
e) 核心:讲解降维后的2个或3个维度可以直接作为 “结构性特征” 送入后续模型。
四:多模型性能评估与模型精调 (Module 4)
1.机器学习核心理论
1)回归问题常用评估指标(R², RMSE, MAE)
2)集成学习(Ensemble Learning)的两大流派:Bagging vs. Boosting
2.【实操】多模型自动化评估流水线
1)构建一个模型评估函数,实现输入任意模型和数据,输出性能指标
2)将多元线性回归、随机森林、XGBoost等模型放入列表
3)循环调用评估函数,一键生成所有模型的性能对比表格,并选择最优模型
3.【实操】最优模型的精细化调优
1)K-折交叉验证(K-Fold Cross-Validation)的原理与实现
2)超参数自动寻优
模块三:模型可解释性与深度拓展
五:模型可解释性(XAI)分析体系与深度实践 (Module 5)
1.可解释性AI(XAI)的知识体系
1)两大类别:内置可解释性模型(白箱) vs. 事后可解释性技术(黑箱)
2)两个维度:全局解释(Global) vs. 局部解释(Local)
3)主流技术地图:特征重要性、部分依赖图(PDP)、LIME、SHAP
2.【实操】全局解释技术:部分依赖图 (Partial Dependence Plot, PDP)
1)PDP原理:分析单个特征如何影响模型预测的平均值
2)使用scikit-learn内置函数快速绘制PDP图,分析关键特征的边际效应
3.【实操】SHAP深度实践:复现顶刊级模型洞察
1)全局解释:shap.summary_plot,揭示特征重要性与影响方向
2)局部解释:shap.force_plot,解剖单一样本的预测归因
3)交互效应:shap.dependence_plot,探索特征间的复杂关系
六:空间预测与专业级成果制图 (Module 6)
1.教学目标与预期管理
2.【实操】像素级空间预测工作流
1)加载已训练好的机器学习模型
2)大尺度影像的分块处理(Block Processing),避免内存溢出
3)将模型predict方法应用于全区像元,生成预测结果矩阵
4)将预测结果矩阵写回为新的地理栅格文件(GeoTIFF)
3.【实操】专业级专题地图制作
1)使用Matplotlib与Rasterio.plot进行栅格数据可视化
2)地图要素定制:颜色映射表(Colormap)、图例(Colorbar)、比例尺、指北针
3)矢量边界与栅格底图的叠加显示与高清地图输出
模块四:空间应用与时空分析
七:工作流复盘与知识迁移 (Module 7)
1.GeoAI项目工作流复盘
1)总结从问题定义到成果输出的全套标准化流程
2)讨论各环节的常见问题与应对策略
2.技术成果的价值提炼与报告撰写
1)如何解读SHAP图谱,将其转化为有决策价值的业务语言
2) Deepseek案例分析:如何将本课程的可解释性分析结果写入科研论文或技术报告
3.【实操】知识迁移与框架复用:如何将本课程的工作流模板应用于其他领域?
1)案例1(城市生态)- 城市热岛效应监测:现场使用GEE代码快速拉取并可视化城市的陆地表面温度(LST)分布
2)案例2(精准农业)- 农作物长势监测:现场使用GEE代码交互式生成农田地块的NDVI生长曲线
3)案例3(水环境)- 湖泊水华评估:现场使用GEE代码快速计算湖泊的归一化差异叶绿素指数(NDCI),识别潜在水华区域
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-5 21:05
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社