yanxiaoyong的个人博客分享 http://blog.sciencenet.cn/u/yanxiaoyong 在路上……

博文

一篇论文被BBC Future报道

已有 18834 次阅读 2013-3-18 09:12 |个人分类:复杂网络|系统分类:论文交流| 论文

前段时间将我们组的一篇论文提交到了arXiv预印本网站,没过几天就被老板告知这篇论文即将被BBC科学专栏报道。今天看到这篇报道已经正式上线了(见http://www.bbc.com/future/story/20130315-a-better-way-to-learn-chinese),作者是Philip Ball(就是写《预知社会(Critical Mass)》一书的那位)。我们这篇文章已经投给了一个综合性期刊,还没正式发出来(当然也可能发不出来,呵呵,世事难预料哇)。不过预印本能被关注和报道,我们还是挺开心的:)

我们的这个工作讲的是如何利用汉字蕴含的结构联系信息来提高汉字的学习效率,用到了复杂网络的研究方法。思路很简单:有联系的知识比孤立的知识更容易学习。特别是对于具有很强逻辑思维能力的成年人来说,理解式学习肯定比死记硬背要更有效率。对于汉字学习来说也是如此,我们中国人都知道大多数汉字都是由更简单的汉字组成的,比如下图中的例子里,“添”字由“水”和“忝”组成,水形忝声,而“忝”字也类似,是心形天声,等等。利用这种汉字之间的结构联系来学习汉字,应该比孤立地识记每个汉字要有效的多(我看过很多留学生用自己的母语给一个一个的汉字标注音,然后背发音、“画”汉字,那叫一个费劲。不过,想想我初学英语时也是标注过“三克油喂尼玛吃”之类的,所以深表理解:)。


那么如何表达汉字之间的这种结构化关联呢?这时候网络分析技术就派上用场了:如果我们在汉字的部首与汉字本身之间连边,那么就能将(几乎所有的)常用汉字构成一个网络(见下图)。这个网络有明显的层次结构,数学上这叫有向无环图(DAG)。汉字网络在结构上的一个突出特点是:最底层的节点数量非常少(在3500个常用字中,只有200多个是最底层汉字),绝大多数汉字都是由层次更低的汉字组成的。那么,采用自底而上的过程显然是一个学习汉字的高效方法(当然也不是纯粹依照层次,还要考虑字本身的常用程度,细节见文章)。基于这样的考量,我们设计了相应的汉字学习策略,希望能对学习汉语的人有所帮助(主要是对学习汉语的外国人,因为小学6年足以让中国小孩用哪怕是最笨的方法把常用字都学会了)。这件事是很有意义的,比如将来老外都学好汉语了,我们就让他们用汉语写文章投我们的CSCI期刊,哈哈,开个玩笑:)



当然,目前我们这个工作的结果还是非常非常初步的,还有很多需要改进的地方。比如对汉字的拆分,虽说大多数汉字拆分起来没什么争议(例如“拆”字,除了“手+斥”,你难以想出其他拆分方法),但也有很多汉字的拆分是有争议的(《说文》里就有一些这样的例子,由于许慎可能没见过甲骨文,他对一些字的解读在甲骨文出土后被证实是不合理的),我们论文中对一小部分汉字的拆分方案可能不是最合理的。另外,汉字学习成本的度量是个认知学的问题,我们的论文对这一点做了极端简化的假设(当然有一定合理性),但真实的汉字学习成本肯定是因人而异的,也是因字而异的。比如,一些汉字拆分后不能提供什么对学习有意义的信息,“汉”字就是一个典型的例子,拆成“水+又”后你也不知道用什么逻辑来识记它(有人说这是汉字简化的结果,实际上繁体的“漢”也没好到哪去,你知道漢的右边念什么嘛?呵呵);而另一些汉字拆分后则很容易理解和学习,比如”简“字,看形(旁)知义,望声(旁)知音。但我们的工作中并没有对这些情况进行详细的区分。所以,我们现阶段提出的汉字学习策略只能是一个建议,还远未达到可以实用化的程度。但这种利用汉字之间的联系提高汉字学习效率的思路我认为是正确且有前途的,上述存在的这些问题我们也会在以后逐步解决或说改进——北师大有国内顶尖的汉字训诂学、认知心理学和教育学方面的专家和研究团队,如果能深入合作,肯定可以进一步推动这个问题的研究。事实上,我们已经开始和校内从事汉字研究的专家(王宁先生和胡佳佳老师)合作了。另外,”汉字叔叔“Richard Sears(他的汉字字源网站是www.chineseetymology.org)现在也在我们的小组里工作,一个可爱的、对汉字痴迷的美国人,呵呵。

对我来说,有点尴尬的是这方面的工作并不是我的主业(我开始做这个工作的时候就有一些熟悉的朋友问我:你怎么干这个呢?呵呵)。这是我来北师大以后第一学期老板们让我做的一个试验性的工作。那时还以上课为主,课余时间就是拆字,拆了半年字,拆到见了汉字就眼花、恶心的程度。后来有点结果了,就开始写文章,然后文章被老板们改来改去(现在这个版本中,我写的文字留下的也就一小半了),我则一直被要求提供新的计算结果和图什么的,又折腾了将近一年。到现在我已经来北师大一年半了,总算投稿了,不过我早已经开始做与汉字完全无关的工作了。当然,这一工作以及我现在的工作都没有脱离复杂系统研究的范畴(我现在主要做人类行为复杂性以及与复杂网络动力学相关的一些研究)。我觉得,复杂系统的研究除了要在理论层面上揭示各种复杂现象背后的机理外,如果能充分利用复杂系统研究领域发展出的各种理论与方法,切实地对解决一些实际领域中的问题做出贡献,才能有持续的生命力。我们的这一工作,可以看做是在这方面的一个尝试吧。



附:
论文全文: Efficient learning strategy of Chinese characters based on network approach
BBC新闻报道: A better way to learn Chinese?



另外,新闻里配的图是谁的书法啊?呵呵







https://blog.sciencenet.cn/blog-404069-671315.html

上一篇:在安卓平板上运行LaTex、gcc和Python等等等等:)
下一篇:我组一篇工作被Nature报道
收藏 IP: 59.108.105.*| 热度|

12 赵星 章忠志 陆君安 王林 李本先 张能立 曾春华 魏代俊 王伟 曹聪 yuyuswh zguodong2006

该博文允许注册用户评论 请点击登录 评论 (33 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 22:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部