随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士 希望在这里留下学术的足迹

博文

我国语料库和计量语言学的早期探索

已有 201 次阅读 2025-12-13 17:50 |个人分类:Computational Linguistics|系统分类:科研笔记

1922年11月,黎锦熙在《国文学会丛刊》创刊号上发表《国语中基本语词的统计研究》一文,经常被认为是语言统计方法用于汉语研究的开始。此文确实是提出了使用科学测验和统计方法,解决汉语教育问题,在理论和方法上提出了重要的研究问题、方向和路径。不过,此文仅有4页,篇幅不大,没有给出具体的统计数据。我们可以把它作为理论文章。

image.png

image.png

著名教育学家陈鹤琴为了教学的目的,从1920年开始,在多位助理的帮助下,对语料统计的基础上,编写了《语体文应用字汇》,1922年发表于《新教育》杂志第5卷第5期987页至995页,含完整字频表的《字汇》于1928年由商务印书馆刊印发行。1922年还遭遇火灾,原始材料被烧毁,幸好一开始的研究成果保留了下来,得以发表。

image.png

image.png

image.png

image.png

注意这段红字,是齐夫定律(1932年发表)的中文陈述。如果陈老用公式写出来,就可以改写学术史了!



https://blog.sciencenet.cn/blog-39714-1514171.html

上一篇:1920年南高师首开暑期学校|用四通八达的教育来创造一个四通八达的社会
收藏 IP: 222.192.2.*| 热度|

1 张学文

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-13 22:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部