||
知识抽取中的停用词处理技术
化柏林
(中国科学技术信息研究所,北京 100038)
(发表于《现代图书情报技术》2007年第8期)
【摘要】 在知识抽取的分词过程中,需要提前把停用词标引出来。停用词处理的关键在于停用词的认定、停用词表的获取与组织技术以及停用词匹配技术。停用词的识别常常需要停用词表,识别过程中需要判断假停用词以降低噪声。实验表明,对停用词进行单独处理可以大大加快词语切分速度以及后续的句法分析归约速度。
知识抽取中的停用词处理技术
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-19 23:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社