sjiong的个人博客分享 http://blog.sciencenet.cn/u/sjiong

博文

什么叫学会一种语言——兼论汉语真的难学吗?

已有 5849 次阅读 2013-1-7 19:23 |系统分类:人文社科

  一个很简单的问题,什么叫学会了一种语言?学会一种语言的语词达到使用频率 99.9999999% 覆盖范围的时候,它算学会了吗?不就是十亿分之一的不足吗?人人都活到老学到老。当他为最后百万分之一、千万分之一而奋斗的时候,语言学习的尽头依旧没有来到吗?这里的数字不是用来耸人听闻的,而是语言事实。冷僻的语词可能以十亿分之一的概率复现,并非我所捏造,尽管它们不是每一个人一生都会遇到。

  不说幼儿园。从小学、中学到大学毕业,词汇量在不断增加。这是在学会语言基础之上的增加,还是依旧没有学会语言?一个成年文盲毕竟是要使用语言的。如果他还能够体面地生活,甚至出人头地,他算学会语言了吗?这时候他可能看不懂交通规则、房租契约和退税表格,甚至看不懂日常生活的便条。他说话能够熟练使用一万个词语,也听得懂十万个语词。也许他积极使用的词语只有数千个。这是多数学龄前的孩子照样能够做得到的。这大概就是学会一种语言的模糊的界限。数千词语并不多,偏偏是语言使用频率最高的部分。关键就是它们在使用中很高的覆盖率问题。也许它就是 99% ~ 99.99% 左右。覆盖 99% 的词应该能够熟练地积极使用,复现率为万分之一的词照样听得懂。学会一种语言就是把握它的系统性和基本词汇。词汇量最低限度因人而异。语言的系统性靠词汇展示,离不开它们组合机遇和联想聚类。

  很明显,应该区分学会语言与继续学习文化的界限。现代科学技术和社会观念在迅速发展演变,新词语层出不穷。正常人还没有学会全部古老的文化用语,新词语迎面又在向他滚滚而来。那是一个无底洞。然而这主要是学会语言以后需要面对的问题。因此,我们不能够回避使用中的覆盖率问题。这就是语言学的权重范围。

  学习汉语会遇到学习汉字的难题。它有多难?也许来自火星的精通逻辑的人会说,汉字比西方 26 个字母难得多。

  真要让火星人去学英语,他会发现,原来还有数十万、上百万语词需要去逐一学习。他懂得逻辑,不难发现英语有词缀和词根结构,进一步他还发现,英语复杂的词根可能是由一个或多个语素组合而成。然而他又注意到,英美普通人居然多数搞不清楚语词的结构问题,只能够整词死记硬背,也就比 26 个字母难得多了。

  火星人又开始学习汉语汉字了。汉语也有数十万、上百万语词,却只使用少数汉字去组装。一个汉字就是一个语素(跟词缀和词根差不多的意思)。汉字跟语词一样都有重复使用的特点。他还发现,学会 2500 汉字,实际使用中遇到生僻字的机会仅仅是一千次里的七八次。学会5000 汉字,遇到罕见字的机会几乎是一万次里的一次。在中国人的观念中,汉字已经是文化基础了。他们都熟记学会的每一个汉字。这些汉字都已经变成他们的经验和常识。在中国,语素并不是超越普通人的难题。为数有限的汉字是百万汉语词的书写单位。尽管那里依旧会有深入学习语词的需要,但毕竟语音线索基本就在眼前,而且表示意义的语素就是那些汉字。这里的难易是最说不清楚的。

  

  在中国,以 3000 字为常用字范围,那么 95.5% 的词种纯由那些常用字组成,只有 0.47% 的词种纯由 3000 字范围以外的字组成。(这一部分是我对为数有限的 2749 常用词的推算,仅供参考。)也就是说,在常用词范围,非常用字的使用比例非常低。3000 字的覆盖范围达到 99.63%,学会这些字已经是 1000 次只有 3.7 次遭遇非常用字的文化水平了。
图示认识500常用字可以看懂36%行文,认识3000常用字可以看懂96%行文

  他跟中国幼儿们一起学汉字,注意到一个事实:一两千汉字难不住他们,也难不住他自己。接着他还发现,他可以跟中国成年人一样去学会 5000 汉字。

  他也注意到,西方研究生学习一点跨学科知识非常困难,难就难在各学科、各行业的语词几乎都不一样。中国人很幸运,三四千常用汉字是各行各业通用的。学会其中 4000 常用字已经达到一千次里只有一次难字的困扰。

  跟许多语种比,汉语的唯一缺点是跟西方各国的语词大多不通用。相反,西方各国越是冷僻的语词,多半各国差不多。这大概也是西方人说汉语最难学的主要原因了。然而西方人为此付出的代价是,他们各语种的语词系统复杂无比,让他们自己也望而生畏。语言文字难易的辩证法就在这里。



https://blog.sciencenet.cn/blog-781460-650674.html

上一篇:汉字简化 合情合理
下一篇:不唯血统 但血统的主线不可缺少
收藏 IP: 77.166.213.*| 热度|

1 何学锋

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-26 14:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部