《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

《朝华午拾:今天是个好日子》

已有 7256 次阅读 2009-12-22 18:45 |个人分类:立委科普|系统分类:科研笔记| 科研, 成功, 突破

今天是个好日子
– 立委研发笔记之二

作者:立委

今天是个好日子。

今天真是个好日子。

什么日子呢?这么说吧,就好比陈景润证出1+1=2的那天,算不算个好日子。

写完上面几句话,兴奋了一天,终于轰然到下,难得地一觉睡到自然醒。所以,确切地说,标题应该是:昨天是个好日子。

我们搞研发的工匠,一辈子辛勤劳作,大多是蚂蚁啃骨头,所做很平凡,看上去也很枯燥。积累的是资源,操作的是实验。在这些漫长的routine工作中,偶然会有征服世界的幻觉,昨天就是这样一个时刻。

如果我说我灵机一动,解决了一个世界难题,一个世纪难题,那肯定是狂人痴语。可是,该怎么说这件事呢?有一个研发课题,有巨大的商业应用价值,很多人想都不敢想,有些人想了,尝试了,根本找不着北,我昨天灵机一动,解决了这个课题。这样的说法可以接受么?当然,这仍然是狂人痴语,可是我找不到更客观谦逊的说辞了。因特大网,吹牛不用上税。没有权威杂志发表,没有带来巨大财富的专利证明,一切就当笑话看好了。

具体细节不能讲,专利也好,商业秘密也好,一切在未定之中。但可以假语村言,与老友分享一下工匠的喜和乐。

故事是这样的。产品副总几个月前找到我,说,我们是做商业情报的,商业情报的重中之重是客户心理,我们的技术可以挖掘客户心理么?

我说 no, I cannot read people’s mind. I am only a linguist.

他说,明白,我们不是算命先生,指的当然是用语言形式表达出来的客户心理情报。

我说 yes, as long as it is expressed in language, we can have a try.

我的要求很简单,给我语言数据样本,说什么样的语言表达,需要从中提取的是什么样的情报。我就可以大体知道我们可以不可以挖掘出来,能挖掘到什么程度。这种判断力我是有自信的。一般来说,只要有关的语言表达法有迹可循,用我们多年积累的工艺(“科学技术”?),总是可以很准确地挖掘出一点情报来的,瓶颈在覆盖面(recall): 难的挖掘课题覆盖面太小,无法应用。大体说吧,至少得有50%的覆盖面才有应用价值。

于是,数据样本来了。立委的判断也出来了,拍了胸脯:可以做。然后就是带领团队蚕吃桑叶一样农村包围城市,步步为营,覆盖了样本。看上去很美,感觉也不错,样本输入黑匣子,指望的情报就挖掘出来。我很高兴。产品副总也很高兴。我们眼看要做成一个没有人能做的伟业。

一周前,我做了个试验,找到一个足够大的具有代表性的真实语言样本(real life language corpus),让黑匣子夜里去挖掘,看看挖掘出什么名堂。第二天早上一看,傻眼了,挖掘量远远不如预期。

怎么回事呢?仔细抽查了样本,详细分析数据,发现了这样一个可怕的事实:语言表达有显性和隐形两种,产品组给我们提供的是显性样本。这也没什么不对,因为显性表达的用词和结构有明显的patterns,挖掘起来比较好办。也因此我敢拍胸脯说能行。本来想,就算显性表达和隐性表达一半一半,如果我们能挖掘前一半,只要我们能处理海量数据,由于语言普遍存在的信息冗余现象,我们还是可以提供客户心理挖掘的服务,使其成为我们产品的 killer feature。

想得太美,可现实是残酷的。分析表明,客户心理的语言表达90%以上是隐形的,显性表达只是冰山一角。客户上帝啊,你有什么想法,喜好和牢骚,为什么不直说呢?我们是多么想了解上帝的心理啊。

苦恼。苦恼了一周。现在这样的覆盖面,根本没有可能做成征服商业情报世界的 killer app.

产品副总也苦恼。说,recall, recall, that is killing us. 怎么办呢?蚂蚁啃骨头,不断啃,做一点算一点,覆盖面总能慢慢改善吧。客户心理是商业情报的皇冠明珠,不管多难,目标多遥远,还是要做。

前天夜里就被这个recall恶魔缠了一宿。到了凌晨四点,恍惚中开了天目,灵感不期而至。当时那个兴奋,真想大叫。看大小领导仍在熟睡。一个人到外屋,兜了几十个圈子,反复验证自己的想法,确认无误,我给公司发了一个短信:

Recall is not an issue in this case. Stay tuned.

口气很肯定,也卖了个关子,吊吊胃口。尤其是产品副总,他被这个恶魔缠得不比我轻。上午一见到他,我说:这样说吧,理论上的覆盖面是100%,实际操作上的覆盖面,不管怎么测量,我拍胸脯保证在 80% 以上。怎么样?

Too good to be true.

他很信任我,知道我不是口出狂言的那种,平时在产品和研发打交道的时候,我都是讨价还价的保守派,能做十分,我只担保八成。今天出此大言,其中必有奥秘。他急于知道,我只给了个引子。具体细节还是等到会上谈吧。召集的是特别会议,包括管理层以及产品组和工程组的技术骨干,有些骨干向来是以挑剔为能事的。首先让他们来检验,看能不能从我的鸡蛋里面挑出骨头来。

一只黑笔,一块白板,立法委员在上面涂鸦。陈景润当年算1+1也是这种场面么?

问题一大框。最终是,蓝图无懈可击,操作性毋庸置疑。当然,实现过程中还有细节可以斟酌,一切最终要看大规模实验的证明。

今天,oops,昨天,真是个好日子!

今天,今天也是个好日子,请听湘女的吉言和歌唱:

[flash]http://www.tudou.com/v/jK30OG2_0H0/&rpid=56834216/v.swf[/flash]
找到了土豆的一个版本(暂时代替youTube李佳娜-今天是个好日子,立委现场拍摄)

 【置顶:立委科学网博客NLP博文一览(定期更新版)】



https://blog.sciencenet.cn/blog-362400-280613.html

上一篇:立委随笔:四傻成就艺术
下一篇:mirror - 北大的“中学校长实名推荐制”的解读
收藏 IP: 192.168.0.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-21 22:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部