|
基于字频相似度的《红楼梦》作者辨析
基于《红楼梦》文本,统计120回每一章回的单字字频数据形成字频向量作为每一回的特征向量,并推算它们之间的余弦相似系数,进而推算前80回之间、后40回之间、以及前80回与后40回交叉的相似系数平均水平,并分别用t检验与Wilcoxon秩和检验两种假设检验方法,考察三者之间差异的显著性水平,结果表明,差异均具有极其显著性水平:前80回之间、后40回之间相似系数平均水平均极其显著地高于前80回与后40回交叉的相似系数平均水平,并且后40回之间的相似系数平均水平极其显著地高于前80回之间的相似系数平均水平。如果认可前80回为曹雪芹一人所著,那么更有理由认为后40回出自另一人之手,同时不排除前80回有后人增补的痕迹,后40回有曹雪芹遗留的残稿。
论文详见中国知网。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-20 06:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社