wangyanjiayou的个人博客分享 http://blog.sciencenet.cn/u/wangyanjiayou

博文

AI大模型赋能自然科学:从数据清洗、统计建模、机器学习到时空分析与科研绘图

已有 692 次阅读 2025-10-28 08:58 |系统分类:科研笔记

AI大语言模型引领了新一波人工智能浪潮,也在自然科学各个过程中提升生产力,本次内容通过生物、地球、农业、气象、生态、环境、GIS科学领域中的大量案例,结合数据、文本、图片、代码、语音、视频等不同形式的数据、模式和内容,详解自然科研的全流程,通过大模型辅助编写Python和R语言代码以及大模型API二次开发等技术对案例进行实现,带领大家快速进入科研新范式。

第一章 开启自然科学研究新范式

①自然科学研究的主要流程

②AI大模型的助力科研新范式

③AI大模型的提问框架(提示词、指令)和专业级GPT store应用

案例1 开启大模型科研新范式

案例2 大模型助力自然科学的经典案例分析

案例3 经典高效的提问模板,提升模型效率

第二章 数据清洗

数据清洗与特征工程

①R语言和Python基础(能看懂即可)

②数据清洗方法(重复值、缺失值处理、异常值检验、标准化、归一化、数据长宽转换,数据分组聚合)

案例1 随机生成数据

案例2 读取各种类型的数据

案例3 进行原始数据进行清洗、切片、筛选、整合

案例4 对农业气象数据进行预处理

案例5 对生态数据进行预处理

第三章 统计分析

统计分析与模型诊断

①统计假设检验

②统计学三大常用检验及其应用场景

③方差分析、相关分析、回归分析

案例1 对生态环境数据进行正态性检验、方差齐性检验

案例2 进行t检验、F检验和卡方检验

案例3 对生态环境数据进行方差分析、相关分析及回归分析

第四章 经典统计模型

经典统计模型(混合效应模型、结构方程模型、Meta分析)构建

案例1 混合线性模型在生态学中应用

案例2 全球尺度Meta分析、诊断及绘图

案例3 生态环境数据结构方程模型构建

第五章 优化算法

案例1 最小二乘法对光合作用模型参数优化

案例2 遗传算法、差分进化算法对光合作用模型参数优化

案例3 贝叶斯定理和贝叶斯优化算法对机理模型参数优化

案例4 蒙特拉罗马尔科夫链MCMC对动力学模型进行参数优化

第六章 机器学习

①机器/深度学习

②线性代数基础、特征值和特征向量

③机器学习监督学习(回归、分类)、非监督学习(降维、聚类)

④特征工程、数据分割、目标函数、参数优化、交叉验证、超参数寻优

⑤主成分分析、LDA、NMS、T-SNE、UMAP、Kmeans、Agglomerative、DBSCAN

⑥支持向量机、决策树、随机森林、XGBoost、AdaBoost、LightGBM、高斯过程

⑦深度学习算法(神经网络、激活函数、交叉熵、优化器)

⑧AI大模型的底层逻辑和算法结构(GPT1-GPT4)

⑨卷积神经网络、长短期记忆网络(LSTM)

案例1 回归模型(多元线性回归、随机森林、XGBoost、LightGBM等)

案例2 分类模型(支持向量机、XGBoost等)

案例3 构建降维模型

案例4 构建聚类模型

案例5 卷积神经网络进行图像识别

案例6 LSTM模型进行气象环境时序预测

第七章 基于AI大模型的二次开发

案例1 基于API构建自己的本地大模型

案例2 实现ChatGPT功能、模型评价和图像生成

案例3 ChatGPT Store构建方法

第八章 科研绘图

①使用大模型进行数据可视化

案例1 大模型科研绘图指定全集

案例2 使用大模型指令绘制柱状图(误差线)、散点图、相关网络图、热图、小提琴图、箱型图、雷达图、玫瑰图、气泡图、森林图、三元图、三维图等各类科研图

案例3 对图形进行修改

案例4 对任务一类科研绘图的制作流程

第九章 时空大数据分析

①R语言和Python空间数据处理主要方法

②降尺度模型

③处理矢量、栅格数据

④处理多时相netCDF4数据

案例1 矢量、栅格等时空大数据进行处理

案例2 处理NASA气象多时相NC数据

案例3 绘制全球植被类型分布图

案例4 栅格数据并绘制全球植被生物量图

案例5 遥感数据并进行时间序列分析

案例6 使用不同插值方法对气象数据进行空间插值

案例7 机器学习聚类分析及气候空间分区

案例8 构建机器学习模型进行大尺度空间预测

①GPT DALL.E、Midjourney等AI大模型生成图片

②AI画图指令套路和参数设定

图像识别、生成图像指令合集、生成概念图、生成地球氮循环概念图、生成土壤概念图、生成病毒、植物、动物细胞结构图、生成图片素材,从此不再缺图片素材

--------------------------------------自然科学 数据清洗 机器学习 统计分析 混合效应模型 科研绘图 时空大数据分析 Meta分析 优化算法 

关 注【科研充电吧】公 众 号,获取海量教程和资源



https://blog.sciencenet.cn/blog-3539141-1507757.html

上一篇:AI+ArcGIS:数据处理、空间分析、可视化及多案例综合应用
下一篇:LPJ模型及LPJ-GUESS模型分析不同气候情景下植被生产力的变化及其对生态系统的影响;植被NPP模拟
收藏 IP: 111.225.71.*| 热度|

1 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-6 00:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部