|
研究团队开发了一种用于识别藻类生长驱动因素的模型 Bloomformer-1,以期应用于南水北调中线工程的管控中。 结果显示,总磷是中线段全线驱动藻类生长的重要因子,尤其是河南段,而总氮对河北段藻类生长的影响最大。
准确可靠地识别藻类生长的影响因素对于淡水资源的可持续利用和科学管理至关重要。 随着科学研究从小数据到大数据的转变,传统机器学习不适应大数据分析的需求,擅长处理大数据的深度学习逐渐受到关注。此前,深度学习偶尔被用于预测叶绿素-a (Chl-a) 的时间序列,但是几乎没有在识别藻类生长驱动因子中使用过。
为了填补这一空白,来自中国、德国和荷兰的跨国研究团队开发了一种基于深度学习的 Transformer 模型 ,Bloomformer-1,用于实现端到端的藻类生长驱动因子识别。
“尽管深度学习模型相比传统机器学习在运行透明度上稍显不足,但在性能上却展现出了显著优势,”该论文的第一作者 钱儆 说。 “我们开发'Bloomformer-1'的目标在于创造一种解释性和性能并存的双赢状况,使得藻类生长驱动因子能够透明且精准地被识别出来。”
钱儆以中国水生生物研究所和德国卡尔斯鲁厄理工学院联合培养博士生的身份开展了这项研究。
为了展示 Bloomformer-1 的卓越性能,研究团队将项目地点选在中国国家大型工程南水北调中线。它与四种广泛使用的传统机器学习模型进行了比较——极限树回归 (ETR)、梯度提升回归树 (GBRT)、支持向量回归 (SVR) 和多元线性回归 (MLR)——结果显示,Bloomformer-1的确定系数 R2 最高(0.80 至 0.94),均方根误差RMSE最低(0.22 至 0.43 μg/L)。
“Bloomformer-1 运用多头自注意力机制,将输入序列中的每个标记与其他标记进行比较,以收集并学习动态关联信息,从而能够透彻理解所有现场采样数据。这是其性能卓越的原因之一。”来自波茨坦大学的共同作者 Stefan Norra教授 说。
文章发表在KeAi期刊Water Biology & Security上,其结果表明,总磷(TP)是影响中线藻类生长驱动的最重要因素,尤其是在河南段,而总氮(TN)在河北段对藻类生长的影响最为显著。
“控磷减磷是控制藻类生长、维持南水北调中线水质稳定的重要策略,而河北地区则需要重点关注氮的控制。”该论文的通讯作者、中国科学院水生生物研究所毕永红研究员介绍说“此外,下一步的重要工作是将Bloomformer-1推广及应用到其他水体中。”
南水北调中线项目采样站点分布草图以及基于Bloomformer-1建模的藻类生长驱动因素结果示意图
© 钱儆,中国科学院水生生物研究所和德国卡尔斯鲁厄理工学院
文章信息
文章标题
Identification of driving factors of algal growth in the South-to-North Water Diversion Project by Transformer-based deep learning
研究团队
Jing Qian, Nan Pu, Li Qian, Xiaobai Xue,
Yonghong Bi, Stefan Norra
文章路径
https://www.sciencedirect.com/science/article/pii/S2772735123000641?via%3Dihub
Water Biology and Security(简称WATBS)创刊于2021年,是由中国科学院水生生物研究所主办,科爱合作的一本覆盖水生生物研究、水生态环境保护及水产养殖等领域的综合性开放获取型(OA)英文学术期刊。
期刊主编由中国科学院水生生物研究所桂建芳院士与美国俄勒冈州立大学前美国渔业协会主席Robert M. Hughes教授共同担任,中国科学院水生生物研究所缪炜研究员担任副主编,由来自中国、美国、巴西、法国、加拿大、韩国、墨西哥、澳大利亚、丹麦、意大利、葡萄牙、俄罗斯、英国、新西兰等14个国家的著名学术机构的74位专家学者担任编委。
WATBS自建刊起三年内提供免费发表机会,所有文章将经过严格的同行评审,一经收录将发表在月活用户超过1700万的ScienceDirect平台,供领域内的学者、及全球读者免费阅读、下载及引用。
主编:桂建芳 院士
中国科学院水生生物研究所
主编:Robert M. Hughes
Oregon State University
副主编:缪炜 研究员
中国科学院水生生物研究所
推荐阅读
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-28 10:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社