gordonfeng的个人博客分享 http://blog.sciencenet.cn/u/gordonfeng

博文

史上最靠谱的一套英语词汇书,从1千词到1万7千词,是我编的! 精选

已有 29749 次阅读 2017-1-1 14:38 |个人分类:当代英语核心词汇|系统分类:科研笔记




(电子书原价¥6.99,亚马逊优惠价 ¥5.59

https://www.amazon.cn/%E5%BD%93%E4%BB%A3%E8%8B%B1%E8%AF%AD%E6%A0%B8%E5%BF%83%E8%AF%8D%E6%B1%87-%E5%88%9D%E7%BA%A73000%E8%AF%8D-%E5%86%AF%E5%9B%BD%E5%B9%B3/dp/B01N6HJE2R/ref=sr_1_150?s=books&ie=UTF8&qid=1483240987&sr=1-150)





(电子书原价¥9.99,亚马逊优惠价 ¥7.99

https://www.amazon.cn/gp/product/B01MSZU05Q/ref=pd_sbs_351_4?ie=UTF8&psc=1&refRID=1DGDHVCHABWVS3ANSYZS)




(电子书原价¥13.00,亚马逊推广价 ¥6.99

https://www.amazon.cn/gp/product/B01N6HGADA/ref=pd_sbs_351_2?ie=UTF8&psc=1&refRID=1DGDHVCHABWVS3ANSYZS)




(电子书原价¥15.99,亚马逊推广价 ¥7.99

https://www.amazon.cn/gp/product/B01N2UKCXL/ref=pd_sbs_351_2?ie=UTF8&psc=1&refRID=YNWH0JPSZQCW312KWN6H)


肯定有人要说:无耻的吹嘘!好吧,我们学术一点,谈一点“英语词表史”(word lists)。


1.    1911年,美国教育心理学之父、哥伦比亚大学师范学院教授桑代克(Edward Thorndike)开始收集包括小学生教科书,儿童文学作品,圣经及其他英语经典,烹饪、缝纫、耕作、贸易等方面的书籍,以及报纸和信件在内共450万字的语料,手工进行统计,于1921年出版了10000词《教师词汇手册》(The Teacher's Word Book);1932年出版了《20000词教师词汇手册》(A Teacher's Word Book of 20,000 Words);1944年和哥大师范学院另一教授欧文·洛奇(Irving Lorge)合作,增加语料到1,800万词,出版了《30000词教师词汇手册》(The Teacher's Word Book of 30,000 Words)。这些词表现在还是各个大纲词汇的重要参考资料。




桑代克《30000词教师词汇手册》中的词频、词汇量及建议适用的年级如下表。


词频(/百万)

单词量

累计单词量

适合年级

>=100

1069

1069

1-2

50-99

952

2021

3

30-49

941

2962

4

19-29

1055

4017

14-18

894

4911

5-6

10-13

1181

6092

8-9

963

7055

7-8

7

593

7648

6

684

8332

5

890

9222

9

4

1064

10286

10

3

1442

11728

11

2

2503

14231

12 (>15000)

1

5209

19440


>2/9

9202

28642


=2/9

1358

30000



总结一下上表,桑代克认为美国学生在小学和初中阶段(1-8年级)应该平均每年认知1000个单词,在高中阶段(9-12年级),平均每年认知近2000个单词,让词汇量至少达到15000。这和当代著名词汇专家 Paul Nation 观察到的英语为母语者每年增加1000词汇量、高中毕业生词汇量达到18000有相通之处(不过Paul Nation 指的是词族,word family,很多派生词不算,这样的话,词汇量要求还要再高50%)。


2.    1934年10月,著名英语教育专家迈克尔·韦斯特(Michael West)博士在卡内基基金会的资助下,在纽约与当时“词汇控制运动”(vocabulary control movement)的顶级专家召开了“英语作为世界性语言的使用”(The Use of English as a World Language)会议。会议指定了由劳伦斯·佛赛特(Laurence Faucett)、哈罗德·帕尔默(Harold Palmer)、桑代克与韦斯特组成委员会制定一个适合外语学习者的英语常用词词表。


在次年于伦敦举行的第二次会议上,《词汇选择临时报告》(The Interim Report on Vocabulary Selection)发布,但是由于二战的影响,由韦斯特负责的最终词表《通用词表》(General Service List of English Words)1953年才得以发表。这份《通用词表》 很快在英语教学领域得到最为广泛的应用,成为一些英语学习词典制定“定义词汇”、教学专家改写名著为简易作品、以及世界各地制定英语教学大纲的权威依据。我国各级英语教学大纲都参考了它。




《通用词表》虽然只有2000单词(加上派生词实际是3400词左右),但是号称覆盖90%以上的口语语料和80%以上的书面语语料,所以给人一个印象:只要掌握了最基本的两三千单词,英语交流即无障碍。这实在是英语学习的一个极大误区。实际上,除了简单的口语,听力、阅读要求的词汇量要近10倍于这个基本词汇量。


3.    1963-1964年,布朗大学教授亨利·库切拉Henry Kučera)和 W. 纳尔逊·弗朗西斯(W. Nelson Francis)创建了100万词的布朗语料库(Brown Corpus)。布朗之后,兰卡斯特-奥斯陆-伯根语料库(Lancaster-Oslo-Bergen Corpus,简称LOB)以和布朗语料库相同的取样原则构建了同时期、同规模的英国英语语料库,这两个语料库随即又成为许多其他语料库的样本。比如,全国四六级考试委员会主任、上海交大杨惠中教授在1982年创建了100万词的《上海交大科技英语语料库》(JDEST),从中抽取出5000词词表,并结合上文提到的桑代克10000词此表、韦斯特的2000词《通用词表》,编写了6000科技英语词汇表,作为附录列入当时的理工科大学英语教学大纲。


库切拉和弗朗西斯1982年的著作《英语用法的词频分析:词汇与语法》 (Frequency Analysis of English Usage: Lexicon and Grammar)我在西工大读硕士时读过:




布朗语料库的词频信息可以让我们清楚地看到不同级别词汇量的文章覆盖率:


词汇量

文章覆盖率

1000


2000


3000


4000


5000


6000


15,851

72.0%


79.7%


84.0%


86.8%


88.7%


89.9%


97.8%


4.    霍顿•米夫林出版公司(Houghton Mifflin)为了编纂学生词典,建造了500万词针对美国3-9年级学生语料的《美国遗产中级语料库》(The American Heritage Intermediate Corpus),并于1971年出版了《美国遗产词频表》(The American Heritage Word Frequency Book)。陕西师范大学图书馆有这本书!1999年俺硕士毕业后,跑陕师大去抄了一个月词频,为我的第一本词汇书进行了分级(1000词一级,见下)。





5.    20世纪80年代,柯林斯出版公司为了和牛津大学出版社、朗文出版公司等在词典出版领域竞争,与已故辛克莱教授(John Sinclair)领军的伯明翰大学英语系合作创建了《柯林斯-伯明翰大学国际语言语料库》(Cobuild),开始只有800万词,在词典编篡实践中很快发现不敷使用,后来将其扩展到2000万词,编出了世界上第一部基于计算机语料库的词典——《柯林斯Cobuild英语语言词典》(Collins Cobuild English Language Dictionary),为词典编纂带来了一场革命。之后这一更名为“英语银行”(Bank of English)的语料库规模持续增加到了超过6.5亿词,柯林斯Coubuild系列词典、语法、教材源源不断走向市场。


这是1987年出版的首部 Collins COBUILD 词典:




6.    1995年 Collins Cobuild 出第二版时,牛津、朗文、剑桥大学出版社也都推出了基于语料库的新版英语学习词典,英国著名语言学家大卫·克里斯特尔(David Crystal)将其称为“四大词典”(The Big Four)。牛津和朗文的词典的重要资料来源是建于20世纪90年代初,由牛津大学出版社、朗文出版公司、钱伯斯出版公司和英国国家图书馆、牛津大学、兰卡斯特大学合建,容量为一亿词的英语国家语料库(BNC)。BNC对收录的语料有系统的规划,但是属于静态语料库,建成之后再无更新,牛津、朗文又各自建设了自己的语料库。


1995年 Collins Cobuild 词典第二版,去掉了名称中的 Language:




这个词典列出了5个级别共14700个最常用单词(700+1200+1500+3200+8100),我硕士同学周雪春的姐姐从加拿大给她买了寄到国内,大部分时间词典在我手上:)我把词典翻了5遍,把这五个级别的单词分别抄下来,又检查一遍。最后利用上述的《美国遗产词频表》补充到15000词,分成初级3500、中级3500、中高级4000、高级4000四个大的级别(每个大的级别内部又分成约1000词一级),出了我的第一本词汇书:



2005年伯明翰大学语料库中心访学,有缘与偶像 辛克莱教授合影:




7.    我国各级英语教学大纲,最多参考到语料为20世纪90年代初的《英国国家语料库》,虽然最开始的一两千词比较稳定,后面的词汇就很难代表当代英语词汇了,而90年代后互联网给整个人类的交流带来了巨大的变化。所幸的是,我们有了《当代美国英语语料库》(Corpus of Contemporary American English,COCA),它是由美国杨百翰大学(Brigham Young University)教授马克•戴维斯(Mark Davies,本词汇系列的共同作者)创建的,收录了从1990年至今(以后还会持续更新)每年2,000万词的语料,总规模已超过5亿2000万词。这些语料由口语、小说、杂志、报纸、学术性内容5个相等的部分组成,是目前最大的动态英语平衡语料库。本系列词汇书单词及词频来自COCA,按照戴维斯教授的说法,这是最为准确的英语词频信息。


-------------------------


好了,历史回顾结束。如果您读到这里,应该已经明了,这个词汇系列的来源决定了它是最靠谱的。4亿多词仔细规划的1990年到现在的语料决定了它的品质。


值得说明的是,COCA的词频信息并不是原始词频,而是考虑了单词在各种不同语料类别的分布情况,引入了“离散系数”(dispersion index)的概念。离散系数在0到1之间,如果一个单词在语料库各个类别中均匀分布,数值就接近1,如果只在极小的范围出现,数值就接近0。用来排序的词频是原始词频与离散系数相乘而得到的调整后的词频。



下表为本词汇系列的词频与词汇量数据



词频(>/百万)

词汇量

适合人群

105

1003

高中生

46

2035

25

3061

16

4042

大学英语四六级、考研

11

5094

8

6073

6

7143

4.9

8001

大学英语四六级、考研


大学英语专业四级


SAT、ACT、托福、雅思

3.9

9078

3.2

10078

2.5

11032

2.1

12105

大学英语四六级、考研


大学英语专业四级


SAT、ACT、托福、雅思


大学英语专业八级


GRE、GMAT

1.8

13082

1.5

14254

1.3

15327

1.15

16183

1

17218


说明一下,所有的音标、释义都来自权威词典,英美拼写、发音、用法的不同都标注了出来。所谓最靠谱,不仅仅是单词的来源靠谱,而是各个方面都是如此。



这一词汇系列,英语版本(其他各主要语言版本也已经或即将出版)只有词频信息,没有释义,内容是中文版的一半左右,定价2.99、3.99、4.99、5.99美元。中文版内容多了一倍,定价为英文版1/3左右,为 6.99、9.99、12.99、15.99人民币。现在亚马逊对后两本书特价推广,《中高级4000词》售价6.99,《高级6000词》售价7.99,出手的好时机!


另外,我有进一步的计划如下:


1) 编一本《终极词汇13000词》,让这个词汇系列总量达到3万。我需要两个合作者,如果你寒假能集中时间做这个,我们合作,收益按工作量计算,如果完成1/3,享受1/3版税,当然还有著作署名权。


2)做网站和应用,学习者可以获取想要的任何数量的单词表,比如前500,前2500等等,因为每个单词都有词频。我需要懂技术的专业人士。


3)还是网站和应用,对学习者词汇量进行测试,然后推荐相应程度的阅读及视听材料,测试过关后发给相应等级的证书。需要懂技术的开发者:)


拜托朋友们在微信转发这个帖子啊(能写点东西,交代下我们的关系则最好),把这套好书推到亚马逊英语书籍首页去!稍后我再想怎么致谢你们:)


《当代英语核心词汇:初级3000词》

原价¥6.99,亚马逊优惠价 ¥5.59

https://www.amazon.cn/%E5%BD%93%E4%BB%A3%E8%8B%B1%E8%AF%AD%E6%A0%B8%E5%BF%83%E8%AF%8D%E6%B1%87-%E5%88%9D%E7%BA%A73000%E8%AF%8D-%E5%86%AF%E5%9B%BD%E5%B9%B3/dp/B01N6HJE2R/ref=sr_1_150?s=books&ie=UTF8&qid=1483240987&sr=1-150



《当代英语核心词汇:中级4000词》

原价¥9.99,亚马逊优惠价 ¥7.99

https://www.amazon.cn/gp/product/B01MSZU05Q/ref=pd_sbs_351_4?ie=UTF8&psc=1&refRID=1DGDHVCHABWVS3ANSYZS


《当代英语核心词汇:中高级4000词》

原价¥13.00,亚马逊半价推广 ¥6.99

https://www.amazon.cn/gp/product/B01N6HGADA/ref=pd_sbs_351_2?ie=UTF8&psc=1&refRID=1DGDHVCHABWVS3ANSYZS


《当代英语核心词汇:高级6000词》

原价¥15.99,亚马逊推广价 ¥7.99

https://www.amazon.cn/gp/product/B01N2UKCXL/ref=pd_sbs_351_2?ie=UTF8&psc=1&refRID=YNWH0JPSZQCW312KWN6H





读书荐书
https://blog.sciencenet.cn/blog-1380776-1024714.html

上一篇:图说美国 10 (2016-11-20):每天5分钟,从美国看世界
下一篇:英语词汇量测试 1: 你有没有1000词汇量?有没有500?
收藏 IP: 173.250.205.*| 热度|

16 黄仁勇 张学文 吉宗祥 杨正瓴 刘全慧 张能立 张骥 秦逸人 孔梅 李天成 李本先 李曙 陈冬生 biofans xlsd guhanxian

该博文允许注册用户评论 请点击登录 评论 (31 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 05:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部