||
在党的二十届三中全会上,明确要求健全因地制宜的发展新质生产力体制机制。新质生产力通过创新驱动,以高科技、高效能、高质量为特征,旨在摆脱传统经济增长方式和生产力发展路径,符合新发展理念。环境科学的新质生产力主要体现在基础数据、数据管理和数据分析三方面。通过增加数据覆盖率、提升数据管理自动化水平和利用人工智能(AI)进行数据分析,实现环境质量的实时监控和管理,为环境保护和治理提供了强有力的技术支持。利用ChatGPT等大型语言模型(LLM)可以进一步提升这些方面的效率,例如,通过自然语言处理技术对大量环境数据进行实时分析和解读,利用机器学习提供污染源的精准溯源及预测分析,从而实现更加智能化的环境监测和管理。
当今,LLM正朝着通用人工智能(AGI)的方向迈进,除了可为科研场景实现更高效、更专业的辅助功能,精确处理复杂任务和跨专业领域处理多类型任务的能力也将极大提高。课程依据当前全球大语言模型的预印本和发表论文,并整理了各学科LLM的使用场景案例,从科学智能(AI for Science)角度分析LLM的优势及当前技术局限性,启发性地为学员提供与自身研究相关的应用思路。课程基于最新进展和各主流网络平台交流经验,整理了提示词工程在解决复杂问题时的多种模式,以掌握如何使用最前沿的提示词工程(Prompt Engineering)技巧,从而准确完成复杂任务。引导学员在未来将AGI应用于科研工作和生活场景中,发掘AGI助力自身发展的可能性。
以ChatGPT等LLM产品为例,在教授LLM方法学的同时,通过随堂实操练习和应用示范,深入探索LLM在环境科学中的应用。首先,学员将学习如何设计和优化提示词,以提升ChatGPT在处理特定环境数据任务时的准确性和效率。之后,课程围绕引导型数据分析和数据可视化方案,详细讲解如何利用ChatGPT进行环境数据的自动化处理和分析,通过实例展示其在污染识别、环境风险评估等方面的具体应用。此外,课程以大型项目开发为例,展示如何集成ChatGPT与现有的环境数据,实现智能化的环境数据管理和决策支持。最后,课程围绕学术论文和项目书写作技巧,结合提示词模版的形式,展示如何使用ChatGPT辅助撰写高质量科研语料。
【学员收益】
完成本课程后,学员将能够:
n 深入理解当前最新型大型语言模型的工作原理和技术架构。
n 熟练ChatGPT的使用技巧,并用于论文写作、数据分析、项目开发等场景中。
n 掌握利用ChatGPT润色出发表水平的学术语料技巧,并撰写高水平的综述。
n 根据使用者不同的统计学和数据分析基础,量身定制大语言模型数据分析模式。
n 零代码基础完成Python项目开发,并在学员的科研场景中实践。
n 熟悉大语言模型在新污染物数智管控、环境风险评估、环境监测领域的实际应用。
n 熟悉大语言模型在环境领域的智能体构建,本地化部署,团队私有化环境问答系统构建。
【培训特色】
全面覆盖:课程涵盖从基础概念到高级应用的各个方面,确保学员系统掌握ChatGPT相关知识,从零基础到上手使用。
实战练习:结合环境科学真实案例和项目,学员可以将理论知识转化为实际操作能力。
专家指导:由一线科研工作者授课,更易理解每位从事科研工作学员需求,并提供专业指导和答疑。
互动教学:采用互动式教学方法,增强学习体验和知识内化效果。
应用广泛:课程内容结合实际应用场景,涵盖论文写作、数据分析、项目开发等多个领域。
附件一、课程大纲
部分 | 内容 |
第一部分 通用型人工智能概述 | 本部分,学员将了解科学智能(AI for Science)的基本概念及其在基础学科中的成功案例,探讨AI的发展浪潮及在通用型人工智能时代AI技术对科研的变革。 1.1 课程概述 1.2 AI 在基础学科中的成功案例 1.3 人工智能的发展浪潮 1.4 通用型人工智能对科研的变革 1.5 如何使用大型语言模型 1.6 实战操作:GPT-4/4o 和 Claude-3的使用 |
第二部分 ChatGPT插件使用和开发 | 本部分将介绍如何使用GPT插件进行数据分析、文献查询、流程图绘制等。学员将学习如何利用GPT插件进行全网引文撰写综述和自建引文综述,基于第三方GPT平台完成一篇文献综述;此外,介绍官网的MyGPT配置详情,并通过实战建立个性化功能的个人专属GPT。 2.1 使用GPT插件数据分析 2.2 文献查询和综述的GPT插件 2.3 GPT插件绘制流程图 2.4 实战操作:尝试和使用GPT商店插件 2.5 大语言模式的文献检索 2.6 全网引文撰写综述 2.7 自建引文综述 2.8 实战操作:完成一篇文献综述的撰写 2.9 简易实现私人GPT 2.10 创建和管理专业知识库 2.11 基于知识库的精准问答 2.12 实战操作:建立个性化的私人GPT |
第三部分 提示词工程 | 本部分整合了当前所有大语言模型相关研究的著名文章,介绍提示词的高阶使用技巧,使GPT进一步提升解决复杂问题的能力。参考当前全球提示词设计大赛的金奖提示词模版,学员可设计自己专属的提示词。 3.1 提示词的基本要素与组成 3.2 OpenAI官方提示词工程内容解读 3.3 思维链的概念和应用 3.4 自动思维链的实现 3.5 元思维链:更深层次的思考 3.6 自洽思维链的构建 3.7 实战操作:用思维链创建复杂问答 3.8 思维树的构建和应用 3.9 思维图谱的设计与使用 3.10 实战操作:利用GPT解决复杂问题的综合策略 3.11 金牌提示词框架 3.12 实战操作:建立专属提示词模版 |
第四部分 生成式人工智能学术写作 | 本部分学员将学习如何开启AGI的学术写作专家模式,以提高在写作中的专业性和具体性。内容包括中英文互译和学术论文润色,包括语言与风格优化、扩写、缩写、降重与纠错。课程结合多场景随堂练习,如撰写高水平学术文章、基金与项目书、学位论文及教案与讲义。 4.1 开启GPT的学术写作专家模式 4.2 中英文互译:日常文书与科研写作 4.3 学术论文润色:语言与风格优化 4.4 学术论文润色:扩写、缩写、降重与纠错 4.5 学术论文润色:个性化提示词应用 4.6 实战操作:撰写高水平学术文章 4.7 实战操作:基金与项目书撰写 4.8 实战操作:学位论文撰写 4.9 实战操作:教案与讲义撰写 |
第五部分 思维链数据分析 | 本部分根据不同学员在统计学和数据分析的基础,分别介绍了自然语言对话方式的数据处理模式和本地运行代码方式的数据分析。 5.1 在线Python终端数据分析 5.2 探索性数据分析策略详解 5.3 利用思维链进行个性化数据分析 5.4 零基础引导型数据分析 5.5 专家级指挥型数据分析 5.6 实战操作:基于Code Interpreter的数据分析与可视化 5.7 实战操作:本地Python和R语言的数据分析与可视化 5.8 实战操作:少样本学习思维链的分析模式 5.9 实战操作:多模态数据分析与可视化技术 |
第六部分 大型语言模型辅助项目开发 | 本部分学员将学习模型训练数据的预处理方法、大语言模型的代码开发逻辑、迁移学习与模型选择技巧等。课程还包括实战操作,如零代码基础完成Python项目开发。 6.1 模型训练数据的预处理方法 6.2 模型代码开发逻辑 6.3 模型选择技巧 6.4 提示词技巧在代码撰写中的应用 6.5 生成式人工智能模式的脚本工程开发 6.6 实战操作:零代码基础完成Python项目开发 |
第七部分 环境科学与科学智能 | 本部分学员将了解环境科学几类代表方向中对科学智能的应用现状,以最新顶级期刊发表文章为例,从技术原理角度解释AI在其中的重要作用,并基于此拓展到AGI的应用展望。 7.1 环境智能化监测 7.2 新污染物数智管控 7.3 环境污染防治和生态修复 7.4 环境过程数字模拟 7.5 区域生态风险 7.6 环境管理最优化决策 |
第八部分 环境数据的智能化分析 | 本部分学员将学会AGI数据分析模式,掌握各自研究领域中的数据现状,学习在如何独立完成数据分析策略构建,交互模式,并结合在线和本地Python的运行环境,获得符合研究目标的数据结果,凝练出结论。 8.1 环境数据特征 8.2 环境数据预处理策略 8.3 智能化分析概念和流程 8.4 AGI辅助的要素和人工监督 8.5 实战操作:环境污染物高通量细胞测试数据的分析和可视化 8.6 实战操作:污染物致毒通路转录组分析和表型注释 8.7 实战操作:高分辨质谱非目标分析数据挖掘 |
第九部分 多模态-环境问题的模型设计和优化 | 本部分学员将了解LLM的多模态学习模式,围绕环境数据中的数值、文本、图像等不同类型变量,设计模型堆栈,并形成集成解决方案。 9.1 多模态数据的概念和应用场景 9.2 机器学习模型训练概述 9.3 知识融合的模型堆叠 9.4 自然语言处理概述 9.5 知识表示和文本挖掘 9.6 计算机视觉概述 9.7 图网络分析方法 9.8 实战操作:基于知识图谱技术的环境模型设计 |
第十部分 环境科学问题的提出到解决 | 本部分聚焦于最优化策略的研究模式,通过精心设计提示词后,建立大模型智能体,设计研究方案,实现自动化多模态研究模式。 10.1 环境研究中的最优化问题 10.2 智能体大模型概述 10.3 智能体的部署和实现形式 10.4 多模态最优化模型 10.5 实战操作:环境问答系统设计和部署 |
详情Vx; 623145513
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-17 10:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社