人生的意义就是思考其意义分享 http://blog.sciencenet.cn/u/qianlivan 天体物理工作者,家乡云南昆明。

博文

如何区分重名作者?

已有 13854 次阅读 2012-3-15 15:41 |个人分类:思考|系统分类:论文交流| 文章, 搜索, 语境, 合作关系

       一词可能有多义,多人也可能共一名。这是众所周知的事实,生活中的重名就和一词多义一样司空见惯。不过一般这二者都不会给生活带来太大困扰,因为词有语境,人有圈子。根据上下文可以判断一个词的准确含义,根据一个人的人际关系也可以准确地认出一个人。

       但是在论文搜索和统计的时候,重名就是一件比较麻烦的事了。通常,按人名搜索文章都比较费劲,尤其是搜索姓李的作者。基本上要是不知道文章具体内容是什么,很难区分不同的作者。但是实际搜索的时候,还是可以搜到,因为通常会知道要搜索的作者和哪些人合作发表过文章。如果这些人的名字不是特别常见,那么这些人就成了标签,可以作为要搜索的作者的特征,比如“和李四合作过的张三”。这种感觉就像是说法兰克福的时候说成美因河畔的法兰克福(Frankfurt am Main)。当然这是单从人名来说的区分方式,如果有其他信息当然也可以用来作为标签,比如“发表过ARA&A的张三”之类。

        昨天有个同事给我推荐微软的学术搜索(Microsoft Academic Search),这个工具和Google Scholar不是一个风格,用来找可用的学术资源比较吃力,但是用来分析引用数、引用关系、作者的合作关系很有效。其中每个作者的合作关系图的结构非常不同,这其实就可以用来作为区分不同作者的一个特征量。但是,有一个问题,制作这个图的时候本来就要区分作者,这样就循环论证了(下图是我的合作关系图,但是图中我变成了华沙军事技术大学的人员……)。所以我提个问题,如果把这个关系图作为一个标签区分不同的作者,然后再做这样的关系图,然后拿新的关系图做标签……如此迭代多次,能让关系图变得准确么?
 


https://blog.sciencenet.cn/blog-117333-548062.html

上一篇:在集群上提交计算任务的bsub脚本
下一篇:看写给“天生哲学家”的书——读《艺术和美是什么?》
收藏 IP: 159.226.169.*| 热度|

3 朱晓刚 张伟 New

该博文允许注册用户评论 请点击登录 评论 (7 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 05:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部