|||
欢迎统计英文词汇中类似汉字的笔画熵与笔画(字母数量)分布图
张学文,2013.11.14
前几天我在博客中提到汉字的笔画熵与不同笔画的汉字数量分布图http://blog.sciencenet.cn/blog-2024-741111.html ,这里我提出对于英文词汇,应当作与此差不多的一种分析。即以一本英文字典为准,针对其中的每个词汇,统计字母数量为n1,n2,n3…的英文词汇数量m1,m2,m3…各为多少。并且由此计算英文词汇的字母数量熵,以及n,m的关系图。
也就是说,把面对中文的字的笔画数的统计,改为面对英文的词汇的字母数的统计。开展类似的信息熵与统计分布函数分析。
我早就想到此问题,但是人懒,没有作这个辛苦的统计分析。欢迎有人统计它。并且获得结果。我猜测其结果与我关于汉字笔画的结果很类似。字母数量为3,6,10,15…n的英文词汇各有多少m,我预言n,m的关系也符合对数正态分布!
欢迎有志者实验、统计之。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 10:59
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社