||
世界各地的化学研究人员正在使用爱思唯尔(Elsevier)的专家策划的化学信息平台Reaxys来寻找他们在广泛领域所需的信息和化合物,从制药药物发现和化学研发到学术研究和教育。最近,Reaxys Content Catalyst背后的团队因其在分析、数据科学和人工智能方面的创新而被授予卓越数据科学奖(Excellence in Data Science Award)。
本文作者与爱思唯尔的高级数据管理专家Anitha Golla博士详细谈了谈其团队的工作,以及他们为不断扩大和更新Reaxys中的内容所做的努力。
1亿份文件和数据
该奖项为印度最大的人工智能会议Cypher22画上了句号,当时Analytics India Magazine杂志于9月举办了第四届奖项。该奖项认可了该团队在人工智能驱动的内容生产平台Reaxys Content Catalyst(RCC)方面的努力,该平台致力于从根本上提高Reaxys中可用的内容,这反过来又有助于提高化学研究人员的研发效率。
获奖的同时,该平台还通过了一个惊人的分水岭:处理超过1亿份文件。
Anitha表示:“这两项成就实际上只是证明了跨职能团队的力量。”
思想的多样性:跨职能的合作
Anitha在德国Karlsruhe Institute of Technology(KIT)攻读生物有机化学博士学位时,培养了在多学科团队中工作的兴趣。
“我的导师有一家小型创业公司,他的目标是为生物学家的研究提供尽可能多的多肽,这些多肽需要既便宜又高质量。为了帮助实现这一目标,我必须与所有这些了不起的人一起工作:物理学家、生物学家、工程师等。”
“从前,我基本上是一个孤独的研究者。但这一经历帮助我了解到,如果你与所有这些不同的人合作,意想不到的事情就会发生。而且可以比你一个人做得更好、更快。”
一个高影响力的团队
Anitha目前工作的复杂性意味着她需要一个跨职能的团队。
她说:“科学界发表了数百万份文件,它们有能力在各个层面改变世界。”它可能是关于一种拯救生命的药物,或者是关于改变我们的决策方式或处理某种挑战。我们的工作是确保这些内容是最新的,以便人们能够以最便捷的方式获取这些信息。"
"我们的客户能告诉我们他们想要什么"
“我们的项目还因完全出于客户需求而脱颖而出,”Anitha补充说。“我们的客户实实在在地告诉我们他们想要什么:能够在过去20多年里发表的专利中迅速找到某些东西:物质、生物目标等。他们希望了解竞争格局,以便能够在这个格局中工作,而不是与之对抗。
“传统意义上,只有一种方法可以获得这种信息:雇用一支化学家大军,逐行阅读这些数百万份文件。但当然,这效率太低了,而且成本很高。因此,我们力图将这一过程自动化。毕竟,爱思唯尔已经将数据科学应用于几乎所有其他方面。”
没有一天是平凡的
该项目涉及一个40多人的团队,取决于需要完成的工作。
“在任何一天,我与来自三或四个不同领域的人一起工作—核心化学家、数据科学家、数据工程师、数据架构师、软件人员,等等,”Anitha解释说:“我必须从像化学家那样思考,检查一个结构是否正确,或者像统计学家那样看待它的精确性。因此,这让我感到很兴奋。”
同时,这也能让工作保持挑战性。“你也许能想出一些对化学家来说有意义的东西。但是当软件领域的人看到它时,他们会说它在计算能力或时间方面太昂贵了。后来,虽然一些东西可能在小范围内有效,但当它被生产化并应用于数百万份文件时,情况就完全不同了。但奇妙的是,每个人都想找到一个恰当的平衡点,让大家都满意。”
向前走,向上走
该项目从一开始就很有雄心。
Anitha解释说:“它不仅仅是一个能够快速、准确地处理专利的平台,它还需要在每次有新事物到来时进行更新和升级——无论是更多的文件还是新技术、方法或产品。它需要成为一个完全模块化的平台,可以很容易地被采用并持续运行。因此,这涉及到大量的规划。”
现在,随着平台被扩展到来自期刊的数据,所有这些规划正在得到回报。计划在2023年进一步迭代发展该基础设施,包括扩展到爱思唯尔的生物医学文献数据库Embase。
Anitha说:在未来的某一天,我看到一个可以让任何内容都通过的平台,且能分支到不同的产品。由于爱思唯尔的大规模分类法,它将能够自行对所有内容进行分类。
“一旦你意识到你可以从数据的角度做这么多事情,天空就成了新的极限——不仅是对化学家和其他生命科学的研究人员,而是针对更广泛的研究界。”
https://www.elsevier.com/connect/how-were-using-ai-to-boost-productivity-for-chemistry-researchers
撰文:Eleonora Echegaray
翻译:Yulia
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 14:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社