|||
摘要:实际应用中,许多研究对象都是抽象的,难以用某种特征向量的形式表示,这使得许多成熟的数据挖掘和机器学习方法难以被采用。不过,通常可将其转化成一个Proximity数据矩阵,使得矩阵中的元素表示两个对象间某种“比较”关系。针对该问题,本文提出仅根据Proximity数据矩阵利用多维尺度分析法(MDS)将研究对象进行向量化表示,即构建了一种向量空间模型。最后,对汉语科技词系统中词语进行了聚类分析,结果表明向量空间模型构建后再聚类的结果明显优于直接针对Proximity数据进行聚类分析的结果,从而验证了该方法的可行性和有效性。
关键词:多维尺度法(MDS);Proximity数据;向量空间模型(VSM);汉语科技词系统;聚类分析
全文见:Proximity.pdf
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 18:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社