Bobby的个人博客分享 http://blog.sciencenet.cn/u/Bobby

博文

科学文献文本挖掘可以发现隐藏的知识发到《自然》上

已有 3483 次阅读 2019-7-4 18:19 |个人分类:科学感想|系统分类:论文交流

美国能源部劳伦斯伯克利国家实验室(伯克利实验室)的研究人员表明,一种没有材料科学培训的算法可以扫描数百万篇论文的文本,并发现新的科学知识。

由伯克利实验室储能与分布式资源部门的科学家Anubhav Jain领导的一个小组收集了330万份已发表的材料科学论文摘要,并将它们输入到一种称为Word2vec的算法中。通过分析词与词之间的关系,该算法能够提前数年预测新的热电材料的发现,并提出目前未知的材料作为热电材料的候选材料。

这些发现以“无监督的文字嵌入技术从材料科学文献中获取潜在的知识”为题发表在7月3日的《自然》杂志上。这项研究的主要作者是Vahe Tshitoyan,现在在谷歌工作的伯克利实验室博士后。


With little training, machine-learning algorithms can uncover hidden scientific knowledge

https://www.sciencedaily.com/releases/2019/07/190703134059.htm


Journal Reference:

  1. Vahe Tshitoyan, John Dagdelen, Leigh Weston, Alexander Dunn, Ziqin Rong, Olga Kononova, Kristin A. Persson, Gerbrand Ceder, Anubhav Jain. Unsupervised word embeddings capture latent knowledge from materials science literatureNature, 2019; 571 (7763): 95 DOI: 10.1038/s41586-019-1335-8




https://blog.sciencenet.cn/blog-39731-1188091.html

上一篇:用CRISPR基因编辑根治艾滋病?
下一篇:结构图像超分辨率显微镜(SIM)技术揭示人类染色体之间的物理联系
收藏 IP: 150.255.15.*| 热度|

2 杨正瓴 强涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 16:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部