我:
在n年前,李开复被谷歌挖去之前,他在微软开展了一个 Natural Interface (NI)的计划
结果他走了,项目就 流产了,
当时的 input 是 text,output 是 微软 Office 里面的 commands 面对的是 Office 的用户
因为各种 menu 的浏览方式已经不能适应用户寻求 commands 的需求,而关键词搜索又太繁琐 于是需要有一个 NI 的自然界面来把潜在的功能提到用户面前。
这跟现在的 bots(Amazon Echo,Google Home) 本质上是同样的任务。当时我就跟微软朋友说,这个任务很 tractable, 给我做,我有十足把握做好。
结果 Siri(买来的)一出来,苹果一下子跨越了这一代 直接从 text 提升到 speech
微软的迟缓和没有 sense 与苹果的拥抱和灵活 成为鲜明对照(见 从新版iPhone发布,看苹果和微软技术转化能力的天壤之别 )
Jing: @wei office如果做成Siri那样还不得被用户骂死啊?竞品要笑死了
我:
不会,office 那个 UI 门槛比 面对手机 apps 的 Siri 更低,基本就是(小数据)搜索的延伸。
可直到今天我们用 Office 还是不能轻易够着很多隐藏的功能 微软愚不可及
Jing:
Siri效果很差,只能玩玩 office这样的功能性产品不能这么试不靠谱的方法
我:
发现菜单的有限,和关键词搜索的太粗以后 微软做过两次stupid的尝试:
一次是弄出一个跳来跳去的小人,花里胡哨不顶用,被用户唾骂以后,推出了二级菜单 把个简洁的界面弄得无比难看 试图把隐藏的功能利用菜单延伸的方式呈献给用户
Jing:
搜索引擎很难做的 “搜索的延伸”,Siri比搜索差远了。office确实UI做得不好,但是换Siri方式会更糟糕
我:
你没懂我想说的
Siri 是再后一步的发展 而且是未来或现在的趋势
对于office 和一切有有不少隐藏功能的应用型软件 其 UI 本来可以是搜索的NLP延伸,就是李开复的那个流产的 Natural Interface (NI) 项目
Jing:
我在微软的时候经常和office的人讨论如何利用bing提升,现在也正在进行中。
我:
由于微软的愚蠢,耽误了整整10年
Jing:
这不是一件容易的事情,这些产品创新说起来容易做起来很难的
我:
应用软件的 UI 界错过了 NI 的绝好时机窗口
Jing:
流产是有原因的,不仅仅是开复走了
我:
结果 NI 的进一步延伸 被 Siri 呈现出大概来了
其结果是,认真的软件 UI 受到了 Siri 玩偶一样的性感时髦的冲击 变得很尴尬 失去了前进的动力,因为 NI 的原思想已经不再时髦
Jing:
类似的东西不是没试过加到office里,而是测试都通不过,这是产品啊老大
我:
那是因为微软没有自然语言核武器
这是个十拿十稳的项目
哪有做不出之理:
一个软件的功能是有限的 对应到搜索是一个非常小的子语言 这种 mapping 在有了NLP parsing 以后,就是小菜。
Jing:
微软的speech不说世界第一也是第一集团了
我:
我没说 speech 就说的是 text
在用软件的时候,很少有人傻傻地跟软件 speak 问题的焦点就是怎样把用户表述的功能说法 映射到软件的隐藏功能去 而且映射有误关系也不大 一来还有回路 二来可以给 top n 结果供用户选择 这样的用户场景对技术太友好了。
Jing:
现在哪个产品做到了?您出来做这个就是世界第一了
很多功能用户不知道怎么描述
我:
不怕,在大多数用户的功能描述尝试被NI消化以后,用户在 NI 接口用着用着就会描述了,这有一个相互适应的过程
很多年来,我们不都不知不觉适应了关键词搜索吗
NI 就是搜索的 NLP 延伸 是最好的NLP应用场景之一
做出来以后,就打包 卖给所有大软件的厂商作为 NI 的标准办法
我:
结果是整个时代出现了这个大型软件的用户界面短板。
出来做都要讲时机的 这个问题我看得很清晰,而且有把握 但不合时宜
因为整个世界被 Siri 和 Bots 弄得疯癫了 虽然后者多是玩具 但经不住这种巨额的投资和大潮的冲击
Jing:
其实没多少人当产品用
我:
你不能说,在巨额投资后,它不会提升:玩具性越来越弱,功能性会越来越强 我这时候反潮流做 text NI 到哪里找钱去?
反过来看这个问题,如果 text NI 你都认为太难 不靠谱 那么 Siri 和 bots 就更该统统枪毙了 可事实是 无数的热钱往里面滚
Jing:
投资总是有限的,那时候巨额投了这个,bing可能就没钱了,现在看bing的重要性显然大多了
Siri和office是两回事
我:
那个投资怎能与 BIng 比啊 bing 是极大数据,一年烧 20 个亿,亏损这么多年 终于有起色 挺住了
可是做 text NI,是小数据项目 给我一个零头
Jing:
跟Google搜索比烧得远远不够
我:
一个亿 我保证做出来
Jing Xiao:
一个亿多长时间做出来?
我:
还是要看人和核武器。
人看错了,又没有核武器,再好的 idea 也是白搭,再好的历史机遇也会错过
我:
抽象的说,做了 30 年,具体的说 就是重起炉灶 1-2年也够了。
Jing:
这真心不是件容易的事
我:
一个人的 meat 是另一个人的 毒药,尺有所短 寸有所长 这件事儿对我还就是容易。
每个人的知识背景是不同的 经历和经验积攒也不同 我真心不是说大话。这个问题的实质就是,如果我不相信我能做出 text UI 我就没法投身到现在的任何大潮去 因为后者的门槛比前者远高,虽然是在同一条延长线上
对于大多数,包括很多天才,text NI 的确不是容易的事儿;要是容易 微软也不会绕了那么大圈儿 推出小人 又推出丑陋无比的二级菜单
但是 会者不难 难者不会啊。
Jing:
@wei !
现在做出来还有很大市场,所有的大型软件都是客户。
Nick:
@wei 你的问题是要快,光说不练,黄花菜都凉了。这把年纪还能做一件事,嫁人要趁早。
刘: 行动起来
我:
别急 别急 我已经立了时间表,going going gone
Jing:
赶紧的!
我:
长得虽丑 也不愁真嫁不出去 如果想嫁的话。
Nick 要不你给个 offer?大家都说你靠谱,见多识广,我也不贪心,至少不是 BING 的一年烧 20 亿。
烧一个亿,不独原子弹,氢弹也给你造出来
Jing:
@wei 您要看竞争对手投入多大,bing不投入早死了,那微软更完蛋了
我:
我知道 BING 的故事。回头看 微软没错。世界上不能只有一个谷歌 上帝也不允许。微软替天行道 值得夸赞。
Jing:
是的
我:
您是 BING 里面出来的?
Jing:
在bing混过一段时间
Nick: 过两天回去找你喝酒
我:
好啊 酒桌上啥都好说
我:
都说 钱诱不如色诱,色诱不如酒诱
Jing:
这个nick擅长
钱,色,酒俱用
Qing:
@wei 慢慢做,创新最需要的是那份蛋定和从容。有几人能像你那样节假日还在话痨NLP的?别担心那些所谓几十上百亿投入的对手。他们主要是出来卖的。我看好你。
我:
我其实不是淡定从容,没那么好修养啊,而是没有看到值得投身的项目。
很 picky 啊,我输不起了
项目错了,可能能得到短期利益,可我一辈子的辛苦想 put a ding in universe 的梦想就泡汤了。 要是年轻 20 岁就没有这种顾虑了,但是话说回来,没有这些年的历练,也不可能有现在的底气
微博上遇到过不知天高地厚的,说,你不就一语言学家吗,一个小公司自封的 chief 吗,写段 DL 代码来练练。我喷。 忍住没说: 老子是上帝,老子可以创造语言,你不过是用 “老子们” 的语言会点编码雕虫小技的码农。蜀犬吠日嘛。
Jing:
@wei 前面nick说得对,您得快
mei:
@wei 我提议过,你的parser,能做个API 吗?NLP as a service。如diffbot.com. They are good revenue. Single founder. Large impact. Recently got $10 million series A from ten cent.
还有,你能做几个语言?
diffbot 的NLP/IE 比FB 好。其实小公司 比大公司做的好是 常有的事。所以大公司只好靠acquisition
我:
现在就是 API,内部也是 API 调用。NLP 做 service 或 component technology 作为 business 以前很少见到挺得住的,但对于个人创业,是可能短期“成功”的,毕竟现在的形势也不同了。
我带领我们组做过 18 个语言,囊括所有主要欧亚主要语言。我自己亲手做的是英语汉语世界语,亲手指导的是法语、俄语、土耳其语。
你说的是 FB 的 deep text??
mei:
FB 几次 NLP effort都差
现在形式是不同
Diffbot 很成功。每个大公司要买,他们不卖
我:
前两年我与FB里面的人聊天,他们才刚想 NL 的事儿,没什么概念,做得很浅。
Diffbot 是个什么背景?
马:
这家公司不算NLP吧 他们主要做爬虫和正文抽取
我:
抽取可以不用 parsing,或者只用一点 shallow parsing
但抽取是 NLP 这个大伞下面的
另一方面,有了 deep parsing,抽取就是一个玩儿。
马:
他这个抽取不是IE而是从html里提取文本
对文本的结构并无任何分析
我:
那是当年 whizbang!
当年做得很好 泡沫破灭投资人撤资
可怜几麻袋源码 白菜价拍卖
最后 inxight 买了也没见消化 自己也当白菜卖了
马:
也许会历史轮回,也许会" This Time Is Different "
mei:
Diffbot 没做parsing做IE
crawling,取text只是第一步
白:
深层就算做出来了,怎么抽取还有很多问题。几个难点:1、多重否定:我不是没注意到这件事他没生气。2、多重模态:我知道他相信你不否认某某的领导能力。3、高阶表述:对油价快速上涨的预期减弱。如果都还原成情感三元组:《对象、属性、极性》,貌似有问题。 你可以放过,前提是识别准确;如果没放过又做了错误识别,就玩大了。
mei:
IE parsing 都只是NLU 的一部分。真正的story understanding 且得做呢。研究生时学的story understanding/knowledge representations, 现在没一家做到。做NLU/AI且得做呢!
我:
白老师说的那些 都见识过。做了四五年了 能想到的 都见到了。只不过 绕弯不过三 这是基本原则 有时有意选择不做。不是不可以做 是不必做。
白老师的所谓三元组的表达更不是问题 因为表达是自己跟自己玩。识别了 还能无法表达 人不会被尿憋死的。
白老师认可一部分长尾可以选择不去做 但警告说不做不过是漏掉长尾而已 对于大数据 漏掉不是问题 问题是没漏掉 却抓反了。 这个对没有经验的开发者 的确是个挑战。对于我们 早已突破了 , 因为选择不做 与识别准确 不在一个量级上。
白:
自己跟自己玩是因为同质化的东东放在一起有计算手段上的优势,来一个异质化的东东,只好撇在大锅之外了。伟哥有本事开小灶,其他人就难说了。
我:
白老师说的这些问题对学习系统构成的挑战要比规则系统大很多。对于学习 不是选择做与不做的问题, 基本上是到不了选不选的那一步,因为缺乏结构。只能撞大运。
白:
不怕漏识,关键是别误识
我:
凡是绕了几层的结构对于缺乏结构的系统 基本上是噪音 如果标识的时候 手工排除 对学习更有利不要指望解决它 最好是不要干扰了学习 把系统弄糊涂。
我们从来不是为深层而深层, 深层从 day one 就是与抽取无缝连接的, 就是为了支持语用的。
不像 syntaxnet 离开应用还有 n 丈远。
【相关】
从新版iPhone发布,看苹果和微软技术转化能力的天壤之别
语言创造简史
【置顶:立委科学网博客NLP博文一览(定期更新版)】
转载本文请联系原作者获取授权,同时请注明本文来自李维科学网博客。 链接地址: https://blog.sciencenet.cn/blog-362400-983955.html
上一篇:
【deep parsing (80/n):植树成林自成景】 下一篇:
《泥沙龙笔记:谈parsing的深度与多层》