|
一个很简单的问题,什么叫学会了一种语言?学会一种语言的语词达到使用频率 99.9999999% 覆盖范围的时候,它算学会了吗?不就是十亿分之一的不足吗?人人都活到老学到老。当他为最后百万分之一、千万分之一而奋斗的时候,语言学习的尽头依旧没有来到吗?这里的数字不是用来耸人听闻的,而是语言事实。冷僻的语词可能以十亿分之一的概率复现,并非我所捏造,尽管它们不是每一个人一生都会遇到。
不说幼儿园。从小学、中学到大学毕业,词汇量在不断增加。这是在学会语言基础之上的增加,还是依旧没有学会语言?一个成年文盲毕竟是要使用语言的。如果他还能够体面地生活,甚至出人头地,他算学会语言了吗?这时候他可能看不懂交通规则、房租契约和退税表格,甚至看不懂日常生活的便条。他说话能够熟练使用一万个词语,也听得懂十万个语词。也许他积极使用的词语只有数千个。这是多数学龄前的孩子照样能够做得到的。这大概就是学会一种语言的模糊的界限。数千词语并不多,偏偏是语言使用频率最高的部分。关键就是它们在使用中很高的覆盖率问题。也许它就是 99% ~ 99.99% 左右。覆盖 99% 的词应该能够熟练地积极使用,复现率为万分之一的词照样听得懂。学会一种语言就是把握它的系统性和基本词汇。词汇量最低限度因人而异。语言的系统性靠词汇展示,离不开它们组合机遇和联想聚类。
很明显,应该区分学会语言与继续学习文化的界限。现代科学技术和社会观念在迅速发展演变,新词语层出不穷。正常人还没有学会全部古老的文化用语,新词语迎面又在向他滚滚而来。那是一个无底洞。然而这主要是学会语言以后需要面对的问题。因此,我们不能够回避使用中的覆盖率问题。这就是语言学的权重范围。
学习汉语会遇到学习汉字的难题。它有多难?也许来自火星的精通逻辑的人会说,汉字比西方 26 个字母难得多。
真要让火星人去学英语,他会发现,原来还有数十万、上百万语词需要去逐一学习。他懂得逻辑,不难发现英语有词缀和词根结构,进一步他还发现,英语复杂的词根可能是由一个或多个语素组合而成。然而他又注意到,英美普通人居然多数搞不清楚语词的结构问题,只能够整词死记硬背,也就比 26 个字母难得多了。
火星人又开始学习汉语汉字了。汉语也有数十万、上百万语词,却只使用少数汉字去组装。一个汉字就是一个语素(跟词缀和词根差不多的意思)。汉字跟语词一样都有重复使用的特点。他还发现,学会 2500 汉字,实际使用中遇到生僻字的机会仅仅是一千次里的七八次。学会5000 汉字,遇到罕见字的机会几乎是一万次里的一次。在中国人的观念中,汉字已经是文化基础了。他们都熟记学会的每一个汉字。这些汉字都已经变成他们的经验和常识。在中国,语素并不是超越普通人的难题。为数有限的汉字是百万汉语词的书写单位。尽管那里依旧会有深入学习语词的需要,但毕竟语音线索基本就在眼前,而且表示意义的语素就是那些汉字。这里的难易是最说不清楚的。
他也注意到,西方研究生学习一点跨学科知识非常困难,难就难在各学科、各行业的语词几乎都不一样。中国人很幸运,三四千常用汉字是各行各业通用的。学会其中 4000 常用字已经达到一千次里只有一次难字的困扰。
跟许多语种比,汉语的唯一缺点是跟西方各国的语词大多不通用。相反,西方各国越是冷僻的语词,多半各国差不多。这大概也是西方人说汉语最难学的主要原因了。然而西方人为此付出的代价是,他们各语种的语词系统复杂无比,让他们自己也望而生畏。语言文字难易的辩证法就在这里。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-26 11:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社