|||
机器翻译课上,就让我们做结构转换的标注,用所谓【中介成分】给句子标注,有点像语法课上画树,弄些复杂的英语句子,说你们的标注, 必须是机器可以模拟的,标注完了,翻译也就差不离了,譬如 【前介定B】 这个四元组是说这个介词短语翻译的时候要前置,它是定语,处于 B 层。这种简单甚至简陋的标注就是当年的MT中间语言,我们试验过很多句子,居然大体都可以对付,英汉翻译出来相当可读。这算是我的两位导师当年的发明创造。 刘老师的教导中,有一条我印象最深。在做标注的过程中,大多数手到擒来,我们英语系出身的人从来就擅长画树(diagramming),做这种标注跟玩似的。但也有卡壳的时候,于是请教刘老师。刘老师没有给答案,只是说:解构不出来,那人是怎么理解和翻译的呢?严格地说,当然有案例,人的认知过程很难算法化,人能翻译,不见得可以让机器翻译。但是我还是觉得他这句教导我受益良多。因为这是一种 mindset 的唤醒,促使我们琢磨人的认知过程如何形式化,哪怕不能完全形式化,也让我们明白卡在哪一个环节,常识、专业知识、还是什么?这种 mindset 跟了我一辈子,它实际上是一种反对智能神秘化的哲学,也就是我后来论过的反伊莉莎(Anti-Eliza)效应。
他如今已是80-90高龄,退休在家。作为语言学家,他对急速变化的语言还是那么敏感,文字也很风趣,特转载于后。
不过,他上课语调特平缓,老北京腔调,下午正犯困呢,一堂课下来,我把大腿掐了无数次。一共就两个学生,围着他家小桌子坐着,阳光从窗户斜射过来,打瞌睡实在不像话啊。
岁数大了没事干,不是看报,就是上网,或者听广播,看电视。还有时候记点东西或哼哼两句。
这样一来,我就成了一个听说读写看全方位的“受众”。
当今社会信息爆炸,怪事层出不穷,作一个合格的受众,真不容易。像最近许多国家“通涨inflation”,而美国却“通缩deflation”,我就弄不清是怎么回事。每年语言使用情况都有评选,今年中国使用最多的汉字是“涨”这个字。跟“涨”有关的词语出现了不少,您知道吗?“蒜你狠”、“豆你玩”、“姜你军”、“糖高宗”、“油他去”、“苹什么”。由此产生了“海囤族”,“省长抓米袋子”、“市长抓 菜篮子”。“族”是指一群人,除了“工薪族”、“银发族”、“月光族”、“丁克族”、“电脑族”、“啃老族”、“寄托族GTER”、“尼特族NEET”这些老字眼儿外,最近又出现了“蜗居族”、“蚁族”、“鼠族”、“傍傍族”、“网络淘课族”。带“族”字的词儿还可以,词义有褒有贬。如果带“门”字儿,那就坏了,没什么好事儿:“水门事件”、“召回门”、“艳照门”、“诈捐门”、“泼墨门”、“拉链门”,“罗生门”等等,不一而足。
随着“通胀”,字母词CPI(消费者物价指数)在各种媒体上随处可见。改革开放以来,中国话里吸收了不少外来语,CPI是利用汉语拼音字母转写的,另外也有用汉字写的, 如“秀”(show)、“晒”(share),等等。台湾最近报道的学校“霸凌”事件,也是来自外来语 bullying,不过为了显示语义而偏离了语音。这几年,国际上流行的一些词儿,也很有意思,如“金砖四国”[BRIC,即四个经济发展很好的国家:Brazil“巴西”、 Russia“俄国”、 India“印度”、 China“中国”](2010年12月又吸收了南非South Africa,成了“金砖五国BRICS”)。相对于这五国,最近出现了“欧猪五国”[PIIGS,即欧洲五个有经济危机的国家:Portugal“葡萄牙”、 Italy“意大利”、 Ireland “爱尔兰”、 Greece“希腊”、 Spain“西班牙”]。这些词的构成,除了音义,还加了诙谐。
另外,网语更厉害,什么“打酱油”、“俯卧撑”、“躲猫猫”,“我爸爸叫李刚”,每一个都是一个典故。据说,海外开了不少孔子学院,学汉语的已超过4000万人,真不知道他们碰到这些,受得了受不了。
最近,更有甚者,一些省市领导在给网友写贺信时,争先恐后地使用“灌水”、“拍砖”、“脖主”、“神马都是浮云”等网语*。这不仅会增加人们的学习负担,而且也会影响汉语规范化。真不知道这些领导怎么搞的。
*注释1)“灌水”=网上发帖子;2)“拍砖”=发表意见/骂人;3)“脖主”=微博作者;4)“神马都是浮云”=什么都不值得一提。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-26 06:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社