||
美国能源部劳伦斯伯克利国家实验室(伯克利实验室)的研究人员表明,一种没有材料科学培训的算法可以扫描数百万篇论文的文本,并发现新的科学知识。
由伯克利实验室储能与分布式资源部门的科学家Anubhav Jain领导的一个小组收集了330万份已发表的材料科学论文摘要,并将它们输入到一种称为Word2vec的算法中。通过分析词与词之间的关系,该算法能够提前数年预测新的热电材料的发现,并提出目前未知的材料作为热电材料的候选材料。
这些发现以“无监督的文字嵌入技术从材料科学文献中获取潜在的知识”为题发表在7月3日的《自然》杂志上。这项研究的主要作者是Vahe Tshitoyan,现在在谷歌工作的伯克利实验室博士后。
https://www.sciencedaily.com/releases/2019/07/190703134059.htm
Journal Reference:
Vahe Tshitoyan, John Dagdelen, Leigh Weston, Alexander Dunn, Ziqin Rong, Olga Kononova, Kristin A. Persson, Gerbrand Ceder, Anubhav Jain. Unsupervised word embeddings capture latent knowledge from materials science literature. Nature, 2019; 571 (7763): 95 DOI: 10.1038/s41586-019-1335-8
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-18 22:23
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社