李雷廷的个人博客分享 http://blog.sciencenet.cn/u/llt001

博文

利用词频确定英语用法

已有 3898 次阅读 2016-6-10 11:37 |系统分类:观点评述

在Google 尚未退出中国时,曾有一位谷歌的工作人员来到我所在大学办讲座,介绍Google的用法。其中有一个技巧多年来我印象深刻,依然在用,说Google可以用来学英语,还做了演示。他给出的思路是,利用Google搜索引擎去搜索多个候选用法,然后比较哪一个用法获得结果数最多,那么就可以得出结论这个用法更可靠。比如,我用Google 搜索“looking forward to” 获得 174,000,000 条结果,然后搜索"looking forward for"获得 1,270,000条结果。从这两次搜索结果可以很容易得出结论,“looking forward to”是正确的用法,而“looking forward for”是错误的,或不常用的用法。这一技巧后来被我用到写英语论文中,比如我用Google Scholar搜索“genetic map”,获得 296,000 条结果,搜索“linkage map”获得 183,000条结果,而搜索"genetic linkage map"获得 51,100条结果,通过简单的对比,可以得出结论,“genetic map”是比较常用的用法,“linkage map”也比较受欢迎,而使用“genetic linkage map”用法的论文相对少一些。

最近,注意到存在一类网站可以简化我上面形容的利用词频确定英语用法的过程——输入匹配规则,直接给出词频统计。Linggle.com就是这种类型的一个网站。对于"looking forward"的例子,Linggle 给出的结果如下:

结果表明“looking forward to”有95%的词频,而“looking forward for”只有1%的词频。而如果充分利用Linggle给出的搜索规则(如下图),相信可以很大程度上帮助英语论文的写作,特别是在写到词穷及用法不确定的时候。

延伸阅读:

Boisson, J., Kao, T. H., Wu, J. C., Yen, T. H., & Chang, J. S. (2013, August). Linggle: a Web-scale Linguistic Search Engine for Words in Context. In ACL (Conference System Demonstrations) (pp. 139-144).

欢迎关注“植物基因组”微信公众号

(微信号:plant-genomes)



https://blog.sciencenet.cn/blog-656335-983645.html

上一篇:谷歌学术的新功能:关键词推荐
下一篇:玛卡基因组论文发表于Molecular Plant
收藏 IP: 58.213.137.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-8 20:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部