||
英文论文的写作者对在线词典和翻译软件都比较熟悉,但是很多人对语料库是比较陌生的。它是一种未被充分利用的能够帮助学术写作的宝贵资源。
这篇文章简要介绍在线英语语料库对于学术写作的作用。
语料库(corpus,复数corpora)是指经过科学取样而形成的电子文本库,存放实际使用中真实出现过的语言材料。语料库一般用于词典编纂、语言教学和传统语言研究等领域。语料库分为很多种,例如英国国家语料库(BNC)、美国当代英语语料库(COCA)、密歇根大学学术英语口语语料库(MICASE)、中文文本分类语料库等。语料库具有动态性,即语料是不断动态补充的,可以追踪到语言成分的产生、成长和消亡。随着各领域用词的流通应用和变化,语料库的容量、选材和抽样也都随之变化。
语料库需要并能够与在线词典、翻译软件和电子期刊库在帮助学术写作方面实现互补。词典的作用是解释单词含义和语法规则。翻译软件能够粗略翻译出句子结构和用词。电子期刊库能够通过标题、摘要或全文给出英文专业术语及其用法示例。语料库则具有以下五个重要作用。
语料库的第一个作用是对不确定的英文细节进行修订。例如,如果在美国当代英语语料库里搜索某词,比如“put on”和“put off”,通常能够看到上百条实际应用的语料。这些各种用法的示例一目了然,比词典在语言运用方面所能提供的信息丰富得多。
语料库的第二个作用是能够提供单词的同义词列表和应用示例,使得写作用词能够变得丰富。
语料库的第三个作用是能够提供比词典更新得更快更频繁的最新学术用词及用法示例。
语料库的第四个作用是提供美式英语和英式英语之间的差异和用法示例。例如,在美国杨百翰大学语料库网站有美国英语和英国英语语料库的链接,用户可以搜索和比较在这两种风格中使用的术语或短语。例如,美式英语喜欢用“in the hospital”,而英式英语喜欢用“in hospital”。这种实际用法上的差异往往是词典、语法书中的理论和翻译软件所无法揭示的。需要注意的是,语料库通常不会解释什么是正确的、什么是错误的。它只是提供现实世界中常用的用法。
语料库的第五个作用是校验翻译器的译文是否正确。在复杂的语境下,即使一些常用的词汇也可能被翻译器译错。英文学术写作的主要困难是把握专业术语和生词,以及一些词汇在特定语境下的特殊含义。要想在细节上准确把握这些词语的用法,以及判断翻译器给出的译文是否正确,就需要使用语料库。例如,中文的“结婚权”可以被翻译为“right to marriage”。对于这种组合词,查词典有可能查不到,而不同的翻译器则可能会给出多种译法,包括“matrimonial right”。这时,我们需要判断“matrimonial right”究竟是表示结婚权,还是表示婚姻中的权利。为了解决这种疑问,可以去语料库检索,甚至包括输入“matrimonial right*”这种带星号“*”的词。星号代表“right”后可能出现的任意字符。通过对语料库中最接近所译材料语境的文本例句分析,可以确认翻译器把“结婚权”翻译成“matrimonial right”是错误的。
国内外一些常用的在线语料库的网址在这里。国外著名的语料库包括以下几个。
美国当代英语语料库(COCA):该语料库免费供人们在线使用,是一个珍贵的英语学习宝库,也是观察美国英语使用和变化的一个绝佳窗口。
英国国家语料库(BNC):该语料库由牛津出版社、朗文出版公司和大英图书馆等机构共同建立,总词量超过1亿,其中书面语约占90%,口语约占10%。
杨百翰大学语料库(BYU corpus):由美国杨百翰大学语言学教授创建,整合了美国当代英语语料库、美国历史英语语料库、美国时代杂志语料库、英国国家语料库、西班牙语料库、葡萄牙语料库等六个语料库的资源。该网站每月大约有六万人使用,或许是目前最为广泛使用的在线语料库。
英语整合语料库(Corpus Concordance English):该语料库包括学术、法律、电视节目、历届美国总统演讲等内容,词量达高数千万,包括口语和书面语两种形式。
密歇根大学学术英语口语语料库(Michigan Corpus of Academic Spoken English):该语料库由美国密歇根大学英语语言研究所建立,内容主要为学术英语口语,词量高达184万。
在你进行学术写作时,不要忘记语料库这个能够为你的翻译质量把关的强大工具!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-10 12:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社