随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士 希望在这里留下学术的足迹

博文

paraphrase翻译为“复述”真别扭

已有 9112 次阅读 2014-4-3 14:55 |个人分类:Computational Linguistics|系统分类:科研笔记

今天讨论班讨论paraphrase在NLP中的应用,看了单词,很生疏,翻译很怪,叫“复述”。

paraphrase (n.)
   1540s, from Middle French paraphrase (1520s), from Latin paraphrasis "a paraphrase," from Greek paraphrasis "a free rendering," from paraphrazein "to tell in other words," from para- "beside" (see para- (1)) + phrazein "to tell" (see phrase (n.)).

原来这个para的意思是“另外的”,phrase是“陈述”。所以国内有人翻译为“复述”。翻译为“复述”是有点糟糕的。因为我们说“复述”往往不是这个意思。根据《汉典》的解释,“复述”指(1)重述别人或自己已说过的话;(2)语文教学上指学生把读物的内容用自己的话说出来。如果翻译为英语,接近重复的意思“repeat”。而paraphrase这种现象在中文术语上,是“相同意思,不同表达”的意思,比较类似于“同义表达”,一时也想不起来中国古人对此现象有何说法。

paraphrase 在外语教学上有用处,对自然语言处理中的机器翻译、自然语言理解、生成具有比较重要的意义。把不同的表达看成一类,可以解决数据稀疏的问题。有趣的是,在机器翻译实践中,使用同样的方式,又衍生出了双语paraphrase。其实这东西,就是短语对译的问题。

单语的复述,可以用搜索引擎来做,比如google、百度的用户搜索日志,不同用户搜索“冬奥会”、“索契”后,点开的页面url相同,则统计出这些单语的搜索词语。

双语的复述,可以用双语平行语料自动抽取。和双语词对齐、短语对齐很相近。

这paraphrase是个好东西,得赶快找个好术语出来。





https://blog.sciencenet.cn/blog-39714-781707.html

上一篇:ScienceTree科普科研一体化设想
下一篇:跨不过的槛——后发国家赶超之难
收藏 IP: 223.65.189.*| 热度|

2 曹聪 章成志

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 23:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部