《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

硕士论文: 世界语到汉语和英语的自动翻译试验

已有 4069 次阅读 2010-2-20 04:42 |个人分类:世运资料|系统分类:论文交流|关键词:世界语,机器翻译| 机器翻译, 世界语

立委按: 不知道苹果怎么得罪当局的,总之,那次回国探亲发现,凡是 .mac 都联结不上(此前路兄提过,我还以为只是部分屏蔽),与 youTube 同等待遇,不愧为是建造过万里长城的国度。我还每年傻乎乎地给苹果网站交几百块钱呢。算了,把 .Mac 东西备份到博客来,立委苹果家页关张了事。 倒霉的苹果。

硕士论文

世界语到汉语和英语的自动翻译试验
–EChA 机器翻译系统概述

中国社会科学院研究生院语言系

立委

1986

第1页

世界语到汉语和英语的自动翻译试验

–EChA机器翻译系统概述

0. 本文是我在导师刘涌泉和刘倬先生指导下所做的毕业设计的论文总结. 共分十大部分:

1. EChA概况: 系统流程图;

2. 世界语: 语言学特点及其研究价值;

3. 层次递归成分体系 CDC: 体现独立分析结果的中间语言;

4. EChA 机器词典, 句子加工场格式;

5. 世界语形态分析: 削尾算法, 关于削缀问题的讨论;

6. 句法分析第一线: 虚词处理, 规则和规则分开的讨论;

7. 句法分析第二线: CDC 的求解, 中间结果分析;

8. 英语形态生成, 汉语形态修辞, 原语和译语对比差异的一般总结, 多义区分例释;

9. 调序: 自底而上加工;

10. EChA 试验结果分析, 汉语和英语的机译文的比较, 关于文学作品可不可以跟机器翻译结合的问题, 修辞的讨论.

第2页
————————————————

1. EChA 概况 ……………………………………………………… 3
2. 世界语: 语言学特点及其研究价值 ………………………………….. 7
3. 层次递归成分体系 ………………………………………………. 13
4. EChA 机器词典 ………………………………………………….. 19
5. 世界语形态分析 ………………………………………………… 23
6. 世界语句法分析(1) ……………………………………………… 29
7. 世界语句法分析(2) ……………………………………………… 31
8. 英语形态生成 ………………………………………………….. 34
9. 目标语调序 ……………………………………………………. 38
10. EChA 试验结果的分析 …………………………………………….. 39
[致谢] …………………………………………………………… 44
[参考书目] ……………………………………………………….. 45
[附录一] EChA 试验结果 ……………………………………………… 46
[附录二] 世界语文摘 ……………………………………………….. 57

~~~~~~~~~~~~~~~

硕士论文全文(世界语版)

Automatika Tradukado el Esperanto en la Chinan kaj Anglan Lingvojn

pri E-Ch/A Mashin-tradukado Sistemo

far Wei Li

1986

ENHAVO

1. Skizo pri EchA …………………………………………… 2

2. Esperanto: Lingvistikaj Trajtoj kaj Esplora Valoro …………… 6

3. La Mashintraduka Interlingvo CDC………………………….. 12

4. EChA Mashinaj Vortaroj kaj Vortotabeloj…………………….. 18

5. Morfologia Analizo pri Esperanto…………………………… 22

6. Sintaksa Analizo pri Esperanto…………………………….. 27

7. Morfologia Sintezo pri la Angla Lingvo……………………… 28

8. Vortrevicigo de la celolingvoj…………………………….. 32

[ BIBLIOGRAFIO ]……………………………………………. 34

[ APENDICO ] Specimenoj de Mashintradukajho el EchA Eksperimento …. 35

(1) La Originala Teksto el “Mashinmondo”…………… 35

(2) Diversaj Frazoj……………………………… 37

(3) Du Poemoj…………………………………… 42

[ INDEKSO PRI TERMINARO ]……………………………………. 47

~~~~~~~~~~~~~~~

关于语言系机器翻译专业立委同志学位论文的答辩情况

[论文题目]

世界语到汉语和英语的自动翻译试验

一一EChA机器翻译系统概述

[论文时间]1985.09-1986.05

[答辩日期]1986.05.24.am.

[答辩委员会]主任:姚兆炜,副研究员; 委员: 刘倬, 研究员, 指导教师;刘涌泉,副研究员, 指导教师;王广义,助理研究员.

[投票结果]答辩委员会四人,四票同意毕业论文通过,四票建议授予硕士学位.

[总评]

论文以世界语为源语,由世界语到汉语和英语进行机器翻译研究和试验,这在我国还是第一次.文章在理论上阐述了不同语言间进行机器翻译的方法和实现的过程,上机试验是成功的.作者具有独立研究工作的能力.

EChA系统的设计中使用了层次递归成分体系的中间语言,试图提供一套适合独立分析和独立综合要求的机器翻译抽象文法,这是该系统设计中的一个独创.在加工过程中也较好地处理了虚词的个性与实词的共性问题.

语言分析中还缺乏语义参数,因此描写自然语言显得抽象性不够.对层次递归成分体系的定义尚欠严谨.

[刘倬研究员评语]

世界语到汉语和英语的自动翻译系统简称EChA系统.以世界语为源语进行机器翻译研究和试验,这在我国还是第一次.

这次试验共翻译了150多个世界语文句,输出了汉语和英语可懂的译文,试验结果是令人满意的.世界语的文句是根据语言学特点选取的,它们基本上能反映世界语的各种句型,这有利于试验EChA系统的能力和适应性.

在EChA系统的设计中使用了一种所谓"层次递归成分体系"的中间语言,试图提供一套适合独立分析和独立综合要求的机器翻译抽象文法,这可以看成是EChA系统设计上的一个独创.从试验和论文中可以看出这套中间语言可以满足不同要求的形式分析和综合的需要.但由于语言中缺乏语义(特别是逻辑语义)参数,所以"层次递归成分体系",作为分析,描写自然语言的一种抽象文法,其抽象性还是不够的.

总之,EChA系统的研制,设计和试验是成功的.

[刘涌泉副研究员评语]

立委指的是一个一对多的翻译系统.在国内来说,还是第一个(语委会的冯志伟在国外搞过一个类似的系统).尽管目前只是一对二,但从设计原则和方法来看,今后加以补充修订,扩充到对其他一些语言也是可行的.

为了解决一对多翻译问题,必须设计独立分析系统,这正如要解决多对一翻译问题而必须设计独立生成系统一样合理.因此说,该系统基本立脚点是正确的.

如何实现独立分析的原则,以便于下一步生成多种语言,是本篇论文的重点.为此,立委建立了一个由六元信息组组成的层次递归成分体系.他没有墨守成规,根据具体情况对于过去的成果进行了补充和改造.这个体系的框架基本上是合理的.不足之处是对语义参考不够.如果再加一个“语义元”,也就比较完美了.目前范围较小,缺少语义信息还可以,一旦扩大,利用语义的必要就会增大.这一点应该作为今后努力的方?向.另外,个别辞句还要加工.

[姚兆炜副研究员评语]

由世界语译为英语和汉语的机器翻译在我国还是初次尝试.文章内容在理论上阐述了不同语言间进行机器翻译的方法和实现的过程,并给出了上机试验的结果, 获得了比较满意的译文.

机器翻译是实验性比较强的学科. 不仅要有一定的理论依据, 而且还须要有在机器上能加以实现的方法和手段. 文章达到了理论与实践相结合的要求.

虽然试验规模不是太大, 但也自始至终完成了机器翻译全过程所要涉及的有关内容.

文章第三节(见P.8)关于层次递归成分体系的形式化定义, 既没有刻划出”递归”的实质, 也没有作到”形式化”的基本表示.

文章第十节(见P.25)前九行整段内容, 对机器的评价 “机器和人没有什么不同”, “机器的无能全由于人的无能” 等等, 用词是欠妥的, 整段内容也是不可取的.

[王广义助理研究员评语] (86.05.21)

一. 就语种来说, EChA世一英/汉机器翻译系统在国内算作者首创, 在国外也属少见. 它的设计成功并实现运行, 获得质量不错的译文, 说明设计者已掌握了机器翻译的基本理论和实现方法.

二. 国内已有的机器翻译系统多属”一对一”的, 实现方法也多是”相关分析”的. 而EChA初步实现了”独立分析”, 且为能在”中介成分体系”上推出功能更强一些的”层次递归成分体系”(CDC), 这是一个发展和进步.

三. EChA系统在加工过程中比较好地处理了虚词的个性与实词的共性问题, 有利于系统的维护和改善.

四. EChA能够处理的语言现象比较丰富和全面, 功能较强, 不仅译出科技文献, 还能应付文学体裁的文献. 由此可见作者在语言学方面有较好的素养.

五. 应当指出, CDC 仍然没有改变以句法分析转换为依据的中介成分体系的基础, 因而目标语(英/汉语)的译文生成就不得不主要地依赖源语的句法分析. 作者试图将CDC用作”中介语”, 则必须更多地甚至彻底地?将CDC改造成一个以语义为基本内核的体系方有可能成功.

六. EChA系统的译文综合, 仍属相关型的. 因此, 作者预计的只要加一线俄语综合(或法语综合), “就能实现世一俄或世一法机器翻译”, 恐怕是过高地估计了CDC的作用.

~~~~~~~~~

[研究生学位课程成绩]

英语 76 (免修考试)  机器翻译概论 80  法语 95 / 88    概率论 及格   俄语 98 / 90    高等数学 良
资本论 优    语言学基础 优   反杜林论 良    离散数学 95   <<邓选>>学习 良   程序设计与上机试验 90    语音训练 95

中国社会科学院研究生院语言系 1986.05



【相关】

硕士论文: 世界语到汉语和英语的自动翻译试验
立委硕士论文:1. EChA概况
立委硕士论文:2. 世界语: 语言学特点及其研究价值
立委硕士论文:3. 层次递归成分体系
立委硕士论文:4. EChA机器词典及词表
立委硕士论文:5. 世界语形态分析
立委硕士论文:6/7 世界语句法分析
立委硕士论文:8. 英语形态生成
立委硕士论文:9. 目标语调序
立委硕士论文:10. EChA 试验结果的分析
立委硕士论文【致谢】【参考书目】
立委硕士论文全文(世界语版)

《朝华午拾:shijie-师弟轶事(3)——疯狂世界语 》

灵感有如神授,巧夺岂止天工

《立委随笔:一小时学会世界语语法》

立委世界语文章 (1987): 《中国报道:通天塔必将建成》

立委世界语论文(1986): 《国际语到汉语和英语的自动翻译》

立委(1988)《世界科技:世界语到汉语和英语的自动翻译试验》

DLT项目背景介绍

立委硕士论文全文(世界语版)

PhD Thesis: Morpho-syntactic Interface in CPSG (cover page)

【关于机器翻译】

【置顶:立委NLP博文一览】

《朝华午拾》总目录




http://blog.sciencenet.cn/blog-362400-296187.html

上一篇:《甜甜花絮:Practice Makes Perfect》
下一篇:佳娜粉丝俱乐部新添玉照

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2020-2-19 06:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部