|||
notes 一哈:
1. “这个” 应该跟“房间”,而不是“(房间)衣服” ,可是“个”是万能量词,这个区分来自什么知识?
2. Next 应该是 O between “穿” and first NP “....衣服”,这个不难,是搭配,语义中间件可以搞定,利用 Next 桥梁。
3. 定语“穿” 目前逻辑语义的既是 S 又是 O 的结果在搞定 2 时候可以修正成 S:人 S - 穿 - 衣服 O(主谓宾)。
4. 这句里面,"进来“ 与 ”房间“ 的远距离关系是最难对付的,这是白老师出此题的精到的所在。最妙的是,即便挨着,我们一般也不说“进来房间”(是可以说,但有些勉强),而是句法词法搅合地说“进房间来”,何况这个 arg “房间”隐藏在第一个 NP 的内部做定语 Mod 或 话题 Topic。这几乎是考验NLU的句法极致了。赞一下白老师此句。4 暂时不指望做了。其余的都是脉路清晰可见可达,一步之遥而已。
远距离的 4 的关系,如果一定想做,我们可以看看在线性语句转化为平面树图以后,语义中间件里面,其距离到底有多远?
第一步:“房间”通过 Mod 到达 “衣服”
第二步:通过 Next 到达 “不允许”
第三步: 通过 OPred (动词性宾语成分)到达 “进来”
可见,即便如此复杂深奥的远距离关系,到了句法以后,相互距离不过是三步之遥:句法的 trigram 而已。可见句法之结构化的厉害。
数一数这个远距离在线性中的距离:
房间 -- 1 衣服 -- 2 穿 -- 3 得 -- 4 过于 --5 暴露 -- 6 的 -- 7 人 -- 8 不 -- 9 允许 --10 进来
换句话说,线性序列的 10-gram 一结构化就成了 3-gram。
古话说:海内存知己,天涯若比邻,信然。
因此 4 虽然从句法语义上看,差不多是最典型繁难的远距离自然语言理解的挑战的一个实例了,但实际上在句法核武器上了以后,还是有路径有希望的。不过是暂时放放,不强求立马去做而已。非不能也,是不为也,是语言学家的 fascinating 的例子,但不是NLU实用上最当紧的任务。
白老师出得如此绝妙好句,也是醉了。声称 NLU 的人有福了,or 有的做了。
【相关】
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 07:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社