Chinese Turing Tests??
Challenging my Chinese dependency parser with puns. The real thing is, structural ambiguity is detectable, but not easily decodable.
As for puns, forget it!
Do you remember the last time you yourself, as an intelligent being designed by almighty God, were puzzled by jokes of puns?
RE: 立委,测试你分析工具的图灵试题来了
大学里有两种人不谈恋爱:一种是谁都看不上,另一种是谁都 看不上。
parse 后一看,居然 合一 (unify)了:真地歇菜了??
日期: 10/11/2012 17:55:00
但是,(镜子曰,世界上怕就怕但是二字),请注意同样的string “是谁都看不上” 是怎样分析的:分析出两种意义
【意义1】是这么断句的:【是谁】 【都看不上】:【谁】 是【是】的逻辑宾语(Undergoer)
【意义2】则是:【是】 【谁都看不上】:【谁】 是【看不上】的逻辑主语(Actor)
哈哈,不傻吧,my baby
当然,同样的string,在目前是无法指望机器输出不同结果的。
实用的 parsing 技术从来没有超出语句级别的 context 来解码句法结构。
据说,类似的中文“图灵试题”还有:
大学里有两种人最容易被甩:一种人不知道什么【叫做】爱,一种人不知道什么叫【做爱】。
这些人都是原先喜欢一个人,后来喜欢一个人。
老友说,最后一句的精彩之处不在分词,在重音位置。机器只能歇菜
当然这些都是戏谑性的 puns,连人都会被绕晕,根本不用做 real life 系统的人分心。实际语言现象中,有的是 low hanging food, 很多 tractable 的问题好多系统都未及涉及呢,教机器识别 puns 这样劳而无功的勾当,根本排不上号。
http://en.wikipedia.org/wiki/Turing_test
《立委科普:机器可以揭开双关语神秘的面纱》
https://blog.sciencenet.cn/blog-362400-621779.html
上一篇:
粳(jing)稻的发音不能随了“老百姓”下一篇:
【立委随笔:中文之心,如在吾庐】