Author: Minoru Yoshida, University of Tokyo
From SIGIR'10
设计了一个重名区分系统,采用命名实体、关键词、URL等特征进行相似度计算。这种方法得到的结果准确率高,但召回率低。针对这种缺点,提出了两阶段bootstrapping的方法,在第一次聚类完成后,提取有关特征,再进行第二次聚类。
https://blog.sciencenet.cn/blog-484653-504777.html
上一篇:
论文阅读计划下一篇:
A Bipartite Graph Based Social Network Splicing Method for..