|
AI大语言模型引领了新一波人工智能浪潮,也在自然科学各个过程中提升生产力,本次内容通过生物、地球、农业、气象、生态、环境、GIS科学领域中的大量案例,结合数据、文本、图片、代码、语音、视频等不同形式的数据、模式和内容,详解自然科研的全流程,通过大模型辅助编写Python和R语言代码以及大模型API二次开发等技术对案例进行实现,带领大家快速进入科研新范式。
第一章 开启自然科学研究新范式
①自然科学研究的主要流程
②AI大模型的助力科研新范式
③AI大模型的提问框架(提示词、指令)和专业级GPT store应用
案例1 开启大模型科研新范式
案例2 大模型助力自然科学的经典案例分析
案例3 经典高效的提问模板,提升模型效率
第二章 数据清洗
数据清洗与特征工程
①R语言和Python基础(能看懂即可)
②数据清洗方法(重复值、缺失值处理、异常值检验、标准化、归一化、数据长宽转换,数据分组聚合)
案例1 随机生成数据
案例2 读取各种类型的数据
案例3 进行原始数据进行清洗、切片、筛选、整合
案例4 对农业气象数据进行预处理
案例5 对生态数据进行预处理
第三章 统计分析
统计分析与模型诊断
①统计假设检验
②统计学三大常用检验及其应用场景
③方差分析、相关分析、回归分析
案例1 对生态环境数据进行正态性检验、方差齐性检验
案例2 进行t检验、F检验和卡方检验
案例3 对生态环境数据进行方差分析、相关分析及回归分析
第四章 经典统计模型
经典统计模型(混合效应模型、结构方程模型、Meta分析)构建
案例1 混合线性模型在生态学中应用
案例2 全球尺度Meta分析、诊断及绘图
案例3 生态环境数据结构方程模型构建
第五章 优化算法
案例1 最小二乘法对光合作用模型参数优化
案例2 遗传算法、差分进化算法对光合作用模型参数优化
案例3 贝叶斯定理和贝叶斯优化算法对机理模型参数优化
案例4 蒙特拉罗马尔科夫链MCMC对动力学模型进行参数优化
第六章 机器学习
①机器/深度学习
②线性代数基础、特征值和特征向量
③机器学习监督学习(回归、分类)、非监督学习(降维、聚类)
④特征工程、数据分割、目标函数、参数优化、交叉验证、超参数寻优
⑤主成分分析、LDA、NMS、T-SNE、UMAP、Kmeans、Agglomerative、DBSCAN
⑥支持向量机、决策树、随机森林、XGBoost、AdaBoost、LightGBM、高斯过程
⑦深度学习算法(神经网络、激活函数、交叉熵、优化器)
⑧AI大模型的底层逻辑和算法结构(GPT1-GPT4)
⑨卷积神经网络、长短期记忆网络(LSTM)
案例1 回归模型(多元线性回归、随机森林、XGBoost、LightGBM等)
案例2 分类模型(支持向量机、XGBoost等)
案例3 构建降维模型
案例4 构建聚类模型
案例5 卷积神经网络进行图像识别
案例6 LSTM模型进行气象环境时序预测
第七章 基于AI大模型的二次开发
案例1 基于API构建自己的本地大模型
案例2 实现ChatGPT功能、模型评价和图像生成
案例3 ChatGPT Store构建方法
第八章 科研绘图
①使用大模型进行数据可视化
案例1 大模型科研绘图指定全集
案例2 使用大模型指令绘制柱状图(误差线)、散点图、相关网络图、热图、小提琴图、箱型图、雷达图、玫瑰图、气泡图、森林图、三元图、三维图等各类科研图
案例3 对图形进行修改
案例4 对任务一类科研绘图的制作流程
第九章 时空大数据分析
①R语言和Python空间数据处理主要方法
②降尺度模型
③处理矢量、栅格数据
④处理多时相netCDF4数据
案例1 矢量、栅格等时空大数据进行处理
案例2 处理NASA气象多时相NC数据
案例3 绘制全球植被类型分布图
案例4 栅格数据并绘制全球植被生物量图
案例5 遥感数据并进行时间序列分析
案例6 使用不同插值方法对气象数据进行空间插值
案例7 机器学习聚类分析及气候空间分区
案例8 构建机器学习模型进行大尺度空间预测
①GPT DALL.E、Midjourney等AI大模型生成图片
②AI画图指令套路和参数设定
图像识别、生成图像指令合集、生成概念图、生成地球氮循环概念图、生成土壤概念图、生成病毒、植物、动物细胞结构图、生成图片素材,从此不再缺图片素材
--------------------------------------自然科学 数据清洗 机器学习 统计分析 混合效应模型 科研绘图 时空大数据分析 Meta分析 优化算法
关 注【科研充电吧】公 众 号,获取海量教程和资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-6 00:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社