|||
你好。
编辑工作很细致,很多译名也更规范,不少地方更加 忠实于原文,排版也漂亮,谢谢。
逐字逐句仔细审阅了稿子,建议如下。多数建议是改正笔误或者错译,少数建议是提供我们认为更加顺畅或信达雅的译法。
祝编安
~~~~~~~~~~~~~~~
下面是部分校正笔记和建议:
(1) 74页【译者按】:他对主流漠视理性主义的现状仍有忧虑,担心下一代学者会淹没在一波又一波的经验主义热潮中,重蹈历史覆辙。
又仔细想了一下,“重蹈历史覆辙” 容易让人不明白,不宜一开始就提(虽然正文中后来提起人工智能领域进展缓慢时,倒是指出过由于无知而“重犯历史错误”),不如删去。建议改为:
他对主流社区漠视理性主义传统的现状颇为忧虑,担心下一代淹没在一波一波的经验主义热潮中。
74页:
而且使其他工作的空间没剩下多少了
读起来不顺。原文:
now there is no longer much room for anything else
没给其他工作留下多少空间
75页:但是,如果我们考虑一个更大的时间段:“大” 最好改为 “长”
像钟表一样,每隔二十多年切换一次
建议改为:
像钟摆一样,每隔二十多年来回振荡一次
(振荡在文中多次提到,突然改成“切换”不妥;“钟摆”比“钟表”更贴切)
75页脚注:
The debate has gone back and forth many times, though admittedly, it is probably not possible to trace
peaks in rationalism every 40 years or so all the way back to the 17th century and Descartes.
关于这个理性和实用的争论反复多次,但必须承认,也许要上溯到17世纪和笛卡尔时代来追寻40年左右一次的理性主义高潮已不大可能。
“也许”放错地方了。“实用” 代替经验主义不好。因为笛卡尔时代就是17世纪,而且原译的”争论“所指也有误。所以如果还来得及,请改成下列译法(这篇文章实在太长,最后的校对工作很重,两天奋战才勉强赶完上一次的回复,而我们又不愿意看到任何明显的误差出现在最终正式发表上。力求精益求精。毕竟此文是本领域的教父级元老撰写,翻译质量不好是说不过去的。谢谢你们辛苦细致的编辑工作,版样真地很专业很漂亮。通过我们的密切合作,加上与原作者的互动,相信这篇译文的质量可以经得起时间的检验)。为这个译法,我们问了作者本人(见下),也与朋友反复斟酌词句,应该是做到比较信达雅了:
理性主义和经验主义的争论已经反复多次,但必须承认,每40年左右就要出现一次理性主义高潮的规律也许无法一直追溯到17世纪,甚至到笛卡尔本人。
根据教授的话,他的意思是,双方你来我往已经很多回合了,虽然实际上(如果)我们一直追溯到17世纪的笛卡尔那里的话,这个理性主义40年一高潮的周期性规律可能并不完全成立。
我提的问题是:
76 页:
And the rationalists have much to off er, especially if the rationalist position becomes more
popular in a few decades.
而理性主义会做出很多贡献,特别是如果理性主义观点在今后几十年逐渐流行的话。
“会作出贡献” 翻译 “have much to offer”,太具体,语气也太肯定了。
特别是,如果理性主义立场在今后几十年逐渐流行,理性主义者可以提供很多值得重视的见解。
76 页:
经验主义慢慢消褪
修辞和文体上个人感觉不如 “经验主义式微”。不过,如果有特别的理由,“慢慢消褪”也可以了。
76 页:
that is well suited to meet the recent emphasis on numerical evaluations and concrete deliverables.
非常适合近来被强调的数值评估和具体成效。
“适合。。。具体成效”动宾搭配不通,“deliverable”是计划中的任务的意思,可改为:
非常适合近来被强调的数值评估和具体的任务。
76 页:
研究界发现在20 世纪90年代早期注重实效的方法变得流行,
这一句译法有问题,“在20 世纪90年代早期注重实效的方法变得流行”并不需要研究界去“发现”,真正的意思是“20 世纪90年代早期”研究界发现应该注重实效的方法。可考虑改为:
20 世纪90年代早期,研究界发现应该注重务实方法,(原因之一是人工智能领域当时正处于严重的资助寒冬)
77 页:
学派之内没有完全的一致,
不如
“学派之内并非完全一致”
77 页:
他说:人工智能真乃愚蠢之极。
我个人觉得,还是加上“所谓”更好,尽管原文没有 so-called。上下文语境看,他反对的是投机取巧的所谓人工智能。
他说:所谓人工智能真乃愚蠢之极。
(21)78 页:
(Our generation has been fortunate to have plenty of low hanging fruit to pick (the facts that can be captured with short ngrams), but the next generation will be less fortunate since)
most of those facts will have been pretty well picked over before they retire, and therefore, it is likely that they will have to address facts that go beyond the simplest ngram approximations.
那些可以采摘得到的低枝果实已经被采摘完,因此,他们将不得不面对那些简单N 元近似方法无法处理的语言现象。
对未来的语气似乎太肯定了,建议缓和一点,这样更忠实于原文( will have been pretty well picked over ),听上去也顺一点:
在他们退休前,那些捕捉得到的语言事实将大多被捕捉已尽,因此,他们很可能将不得不面对那些简单N 元近似方法无法处理的语言现象。
79 页:
(关于中心嵌套的语言事实一直存在争论。)
我在硕士论文中[9]所使用的中心嵌套的几点论证就受到一个审阅者的反对。
这里是误译,审阅者反对的是乔姆斯基,而不是作者。作者在其早年的硕士论文中,也对乔姆斯基提出过类似审阅者的质疑。作者把二者联系起来,说明乔姆斯基的论点一直存在争论。正确的译法是:
本文审阅者之一反驳中心嵌套所用的几点论证,我当年在我的硕士论文中也提过类似的质疑。
79页:
Attempts to capture unusual long-distance dependencies tend to fix a few unusual fringe cases, but break more cases than they fix.
我们试图捕捉不常见的远距离依存关系去解决一些不常见的边缘案例,但它们带来的问题往往比解决的问题要多。
翻译不确切,原文的意思是虽然这样做解决了一些问题,但得不偿失。
尝试捕捉不常见的远距离关系也许可以处理一些不常见的边缘案例,但它们带来的问题往往比解决的问题要多。
80 页:
The objection also has implications for popular techniques in Information Retrieval such as the Vector Space Model and Probabilistic Retrieval, as well as the use of similar methods for other pattern matching tasks such as
这种反对对信息检索的流行技术,例如向量空间模型。。。也有都影响。
“反对”在这里容易误解为动词,不如用“反对意见”或“反对观点”明晰。“也有都” 是笔误,应为“也都有”。这里的 implications 本义是这些反对意见是适用(针对)这些方法的,“有影响”的译法传达不出来这种批评的适应性。也许可以考虑下列译法:
这种反对意见对信息检索的流行技术,例如向量空间模型 。。。也都适用。
80页:
于是可以把多数文章作为训练集设置一个模型
“设置” 不如 “建立”(原文是 fit,讲的是建立模型的训练过程中慢慢使模型适应数据),因为 设置 (set or set up)一般指的是设计阶段,与训练和开发没多少关联。而“建立”则可以包括后者。而且学界也常用“建立(模型)”的说法。
所以最好改成:
于是可以把多数文章作为训练集建立一个模型
81页:
学习排名的方法可以利用许多特征。
“学习排名”(原文:Learning to rank)这样的译法(“学习”和“排名”都是生活常用词汇)可能让人困惑。改成“学习网页排名(的方法)”或者“网页排名的学习(方法)”就清楚多了(虽然原文没有“网页”),这样就接上了上句提到的“网络搜索引擎”。
学习网页排名的算法可以利用许多特征。
81页
最近有一个博客讨论学习排名
感觉下列译法更清晰:
最近有博客这样讨论网页排名的机器学习
82页
and can diagnose the reason for the failure from the theory.
从而诊断理论上失败的原因。
此译有误,不是理论的失败,而是用理论(from the theory)诊断失败(这里通篇强调的是理论的重要性):
从而可以用理论帮助诊断失败的原因。
83 页:
That said, if one is in the business of building speech synthesis products, one would be well advised to do whatever finesses it takes to get a quality product out the door on time and on budget.
也就是说,如果一个人在工业界设计一个语音合成产品,那还是建议他采用任何工程手段和技巧来保证在预算范围内按时按质交付产品
“也就是说”的译法不对,因为,那不是应有的转折语气(That said)。原文是:
话虽这么说,如果你在工业界领导一个语音合成产品,为了在预算内按时按质交付产品,采用任何工程手段和技巧都是题中应有之义。
83页:
有应用语言学家对十年来的理论进展和对计算机无动于衷
两个“对”的并列读起来拗口,建议还是分开来:
也有应用语言学家对十年来的理论进展无动于衷,对计算机也很木纳
83页:
The life's work of a generation ago (a concordance, a glossary, a superficial grammar) is the first small step of today, accomplished in a few weeks (next year, in a few days), the first of 10,000 steps toward an understanding
of natural language as the vehicle of human communication
前一代人需要一辈子做的工作(譬如建立对照语库、词汇表、浅层文法),只是今天工作的第一小步,借助计算机几个星期即可完成(下一年,只需要几天)这些工作。在对于作为人类交流工具的自然语言的理解方面,是万里长征的第一步。
上句读起来很不顺口,虽然似乎离原文的词语次序更近。我觉得可以把句式次序调整一下:
前一代人需要一辈子做的工作(譬如建立对照语库、词汇表、浅层文法),如今借助计算机几个星期即可完成(下一年大概只需要几天)。在对于作为人类交流工具的自然语言的理解方面,人类迈出了万里长征的第一步。
83页:
refrained from airing dirty laundry in public.
并避免在公共场合泼脏水
建议改为:
并避免在公共场合过度渲染。
我对把“airing dirty laundry in public” 译成“在公共场合泼脏水”有怀疑。汉语的“泼脏水”一般指的是人身攻击,而这里说的 AI学界的问题,不可能指人身攻击。我的理解是指人工智能在不成熟的时候就已经在公共媒体喧闹太久。
词典上说: air dirty laundry in public to talk to other people about personal things that you should keep private
指的也是把专业话题不适当地闹到媒体上,太过做秀(人工智能和粒子物理都有过这个媒体泡沫问题,结果是过度的投资和过高的期望,最终是更大的失望和资助的寒冬)。
83页:
We shouldn't dismiss ALPAC with physics envy.
我们不应该羡慕物理学领域的状态, 而排斥ALPAC 报告。
虽然字面上更接近原文,但感觉不如下面的译法顺畅(尤其是联系到上下文的语气):
我们其实没必要羡慕物理领域的状态,以此排斥ALPAC。
同理,随后的句子中
物理学几乎就不处于令人羡慕的位置
读起来显得拗口,建议译为:
物理学根本就不处于一个学界令人羡慕的位置
84页
"ALPAC:(in-)famous report"
《ALPAC:著名(臭名昭著)的报告》的文章中,总结道(使用英国的拼写办法)
建议加个连词“抑或”,译成:著名(抑或臭名昭著)的报告。。。
建议删除“(使用英国的拼写办法)”,因为它没什么价值,只会使读者糊涂。原文插了这么一句是因为引语的英文拼写法与美式英语显然不同,可是翻译成汉语后,这种区别无法保留和传达,因此加上这个插句就多余了,而且可能让人糊涂。
84页:
and did not appear to justify the level of financial support it had been receiving.
似乎收获与所得到那么多的资金支持不相称。
“收获”不确切(直译是“获得那种水平的资助”),译句读起来也不顺口。建议:
似乎确实没有正当理由获得那么多的资助
84页
whereas applications in the second area should be evaluated in terms of practical metrics: speed, cost and quality
而第二类应用应该在实用指标:速度、成本和质量方面进行评估。
建议删除冒号或者把冒号改成逗号。或者保留冒号,但需要调整句式,使得冒号后面只有名词的联合:
而评估第二类应用程序应该着重于实用的指标:速度,成本和质量。
(42)84页
These two recommendations call out two sides of Pierce that enable Pierce to endorse two positions as different as Chomsky and Shannon.
皮尔斯的这两个建议表明了他与乔姆斯基和香农的观点不同的两个方面。
原文的确有点绕。译文有误,正确的翻译是:
皮尔斯的这两个建议凸显出他的两个不 同侧面,正由于这种两面性使得皮尔斯能够同时认同乔姆斯基和香农那样不同的两种立场。
84页
具有支持应用的一面的皮尔斯应该会对谷歌的商业成功深为感动,
“impressed”不是“感动”,而是印象深刻。原文是:
the applied side of Pierce would be impressed by Google's business success,
皮尔斯的应用一面应该会对谷歌的商业成功留下深刻印象,
84 页
That said,the success is less clear cut for Google's side businesses in speech recognition
and machine translation.
就是说,谷歌的边缘业务如语音识别和机器翻译是否成功还不像在搜索方面那样清晰。
“That said”是转折,不能译成“就是说”。原文:
尽管如此,谷歌的边缘业务如语音识别和机器翻译是否可以称作成功,从他的角度应该还有疑问。
(如果一定要做到字面“忠实”,可以考虑把“从他的角度应该还有疑问”改成“并不清晰”。不过个人觉得,前者其实更准确。)
84页
a skeptic like Pierce would find it hard to justify the R&D investments the community has made over the decades.
比起过去几十年研发的巨额投资,像皮尔斯这样的怀疑论者会觉得,机器翻译和语音识别的应用成就仍然与这几十年的投入不相称。
译文读起来不顺,可能因为两次重复:“比起过去几十年研发的巨额投资”和“与这几十年的投入”:
像皮尔斯这样的怀疑论者会觉得,比起过去的几十年研发的巨额投资,机器翻译和语音识别的应用成就并不相称。
84 页
What does Pierce have to off er us today?
皮尔斯的思想中有哪些是我们今天必须撷取的
“必须”太强,建议改为“可以”。或者干脆直译:
皮尔斯今天能给我们提供什么?
85页
In good times, when there are lots of easy pickings, we should take advantage of the opportunities. But
if those opportunities should dry up, we would be better off following Pierce's advice.
It is better to address the core scientific challenges than to continue to look for easy pickings that are no longer there.
在有很多果实容易采摘的好时光里,我们应该充分利用这个机会。但是,如果这些机会终究会枯竭,我们最好还是遵循皮尔斯的教诲。认真面对核心科学挑战比继续寻找不会再有的、容易采摘的果实要更明智。
“should dry up”(逐渐枯竭)是很常见的虚拟条件从句,不宜译成“终究会枯竭”的语气。最后那一句读起来突兀,也不大顺。“不会再有”语气太强(“不再有”可以,no longer there)。
在有很多果实容易采摘的好时光里,我们自然应该充分利用这些机会。但是,如果这些机会逐渐枯竭,我们最好还是遵循皮尔斯的教诲,认真面对核心科学的挑战,而不是继续寻找不复存在的容易采摘的果实。
85 页
‘把这些理论更新至今天’
这个译法很拗口。“up to date” 是个成语,就是“更新”的意思,没必要提“今天”。
bring those theories up to date.
‘把这些理论更新’
85页
Possibly yes,in the sense that discoveries have been made that may, in time, turn
out to be of fundamental importance.
也可能是在某种意义上,有些发现会在适当的时间显出其基本的重要性
“也可能是在某种意义上”误译了原文“Possibly yes,in the sense that 。。。”。Possibly yes 是回答前一个问题的语气,并不修饰 in the sense (在如下的意义上,而不是“某种意义上”)。
可能确实也有些现在的发现随着时间也会逐渐显出重要性。
85页
Manning et al. (2008) have a brief reference to Minsky and Papert (1988) as a good description of perceptrons,
曼宁等人的2008 版教科书[19] 中在介绍感知机好的方面时,简单提及了明斯基和帕佩特1988 年的论文
“good description” 指的是(明斯基和帕佩特)介绍(描述)感知机介绍得不错,并非是说“感知机好”(其实那篇名为《感知机》的人工智能著作有很多对感知机的批评)。
曼宁等人的2008 版教科书[19] 有简短的文献指向明斯基和帕佩特1988年的论文,称其对感知机有不错的描述,
85页
Bishop (2006, p. 193) makes it clear that Minsky and Papert are no fans of perceptrons and neural networks, but dismisses their work as incorrect conjecture.
毕夏普明确指出,明斯基和帕佩特不是感知机和神经网络的支持者,并且认为他们的工作是“不正确的构想”而予以排斥。
“他们的工作”容易引起混淆,他们是谁?
毕晓普(Bishop)明确指出,敏斯基和帕佩特绝不是感知机和神经网络的赞许者,而是把它们认作“不正确的构想”予以排斥。
86页
Both sides of the debate have much to offer.
辩论双方都要提及。
不是“提及”的事儿,这里是说双方都有很多自己的观点。
辩论双方都大有可言。
86 页
We do the next generation a disservice when we dismiss one side or the other with harsh words
like incorrect conjecture and not much has changed.
用尖锐的词汇如“不正确的构想”和“没有多少改变”来排斥任何一方的论证都是对我们下一代的不负责任。
这个翻译是不对的。原文本身的表达确实也不够明晰,容易引起误译。但是看了全文以后,我们清楚地知道,“不正确的构想”和“没有多少改变”是前辈大师对人工智能及其发展的尖锐批评(与“We”无关),是本文作者认为值得重视的观点,而不是需要指责的事儿。(本文作者对教科书忽略他们的激烈批评的观点,颇为不满。)
排除任何一方的论证都是对我们的下一代不负责任,尤其是当其中一方的批评是如此的尖锐,用到“不正确的构想”和“没有多少改变”这样的说法。
86页
“任何时候,只要一个语言学家离开这个研究组,识别率就会上升。”
删除“这个(研究组)”或者改为“本(研究组)”。因为他说的就是他在IBM领导的小组,而“这个”可能让读者以为是指其他的小组。
这是一个非常著名的NLP掌故,见我的博客:
【立委随笔:文傻和理呆的世纪悲剧(romance tragedy)】:
http://blog.sciencenet.cn/blog-362400-622938.html
86页
(e.g., agreement constraints and wh-movement).
(例如一致性关系的限制条件和位移)。
不能省去 wh-,因为 wh-movement 是语言学中很突出的现象和术语。
(例如,一致关系的限制条件和 wh-位移现象)。
87页
but may not have heard of Greenberg's Universals, Raising,Equi, quanti er scope, gapping, island constraints and so on.
格林伯格共性(Greenberg’s universals)、提升、等同、量词辖域、空缺、孤岛条件(island constraints) 等语言学现象
这些都是非常专门的语言学术语,而相应的汉语译名却很像是普通词汇(提升、等同、空缺),因此建议全部在括号中标注原术语。
格林伯格共性(Greenberg’s Universals), 提升(Raising), 等同(Equi), 量词辖域(quantifier scope), 空缺(gapping), 孤岛条件(island constraints)语言学现象等。
87页
呈现论文(present a paper)不如 宣讲论文 的译法好。
88 页
数据从未像现在如此丰富,我们能拿它做什么呢?
“从未像像现在如此丰富” 读起来很拗口,或者翻译成“像现在这样丰富”,或者译成 “从未如此丰富” (像现在 已经隐含其中了):
数据从未像现在这样丰富,我们能拿它做什么呢?
88 页
So too, there will soon be a day when stress will become important for speech recognition.
所以很快也将有一天,重音将成为语音识别的重要依据。
删除误译“所以”,这里没有因果关系。原文的 “So too” 是 “也这样”的意思,说的是语音识别与机器翻译一样,也会越来越多地使用越来越丰富的语言学表达(利用重音就是这种语言学表达的利用)。
同样,很快也将有一天,重音将成为语音识别的重要依据。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 04:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社