《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

立委专业背景

已有 6634 次阅读 2010-2-19 05:14 |个人分类:立委其人|系统分类:人物纪事| 背景, 自然语言处理, 信息抽取, 计算语言学, 问答系统

立委,计算语言学博士

背景概况:

1997年到美国纽约州水牛城(Buffalo)Cymfony创业,帮助公司创始人Srihari教授,把一个两三人的公司发展到70多人,三处 Offices (Buffalo, Boston, and Bangalore), 在业界具有一定影响的中小型企业。先从美国政府申请研发项目基金,后联系华尔街风险投资人的天使启动金(100万美元)和第一轮投资(一千万美元),得以设计自然语言处理(Natural Language Processing)平台,平衡机器学习和规则处理,开发了产品。

Cymfony公司核心技术InfoXtract的设计人,并亲手实现 shallow parsing, deep parsing,relationship and event extraction 等关键模块。作为项目负责人(Principal Investigator), 前后成功获得美国政府17个小企业研究创新资助项目(Small Business Innovative Research Phase 1, Phase 2 and Enhancement Grants),计900万美元。 对于信息抽取 (Information Extraction) 这个自然语言处理最具应用前景的方向有深入全面的研究,对其发展蓝图,应用价值有独到的体会和全景的认识。

我在这方面的设计思想主要体现在几篇项目最后报告(SBIR Final Reports)上,对政府有关科研项目的确立有直接影响。信息抽取的这一相对较新的研究方向,业界普遍认为应用潜力很大,因为它直接弥补了传统搜索技术的不足,同时由于抽取的目标已知,从而变得切实可行,避免了对于自然语言深度理解以及人工智能(比如常识推理)的过度依赖。

我领导的团队在政府资助机构建立了很好的信誉。作为政府项目资助人,AFRL信息提取小组由于资助了Cymfony的研发项目并导致该技术同时转化到商业产品和政府机关的实用系统,2004年荣获产品转化奖,这也是对我们工作成就的肯定。

我的研究组在搜索业界年度盛会TREC(Text Retrieval Conference)首届自然语言问答系统比赛(TREC-8/QA Track)中,用信息抽取技术支持问答系统,获第一名,对问答系统领域的发展有广泛影响。在国际学术刊物和大会发表论文多篇。

有技术转化成产品的经验(和教训):Cymfony公司旗舰产品 Brand Dashboard 和 Digital Consumer Insight 系统中的关键功能,比如,brand tagging, message tracking and quote extraction, 都是我亲自设计和实现的。该产品在业界和用户中反响很好,曾经多次获奖。Cymfony 几度被业界杂志 KMWorld 列为100家对于知识管理行业最具有影响的企业之一(100 Companies that matter in Knowledge Management)。此前,我们的产品 The Brodeur Brand Dashboard powered by Cymfony: A Tool for Measurement and Analysis 曾获一系列软件奖: MITX 2004年决赛奖 (finalist for the MITX Awards), Finalist For 19th Annual Codie Award, 2003 Massachusetts Interactive Media Council (MIMC) Awards. ([cymfony.com]),等。《财富》杂志,《华尔街日报》等对本公司及其产品均有报道。

2006年夏天,Cymfony 的水牛城 office 跟波士顿总部分开(spin-off),成立 Janya Inc.公司,专营政府项目。2007年二月专营战略广告资讯的跨国公司 TNS Media Intelligence 并购了波士顿的 Cymfony 公司。公司spin-off以后,我留在 Janya Inc. 继续研发副总的职责。此后不久,我决定以此作为转折点,离开相对闭塞的水牛城,寻找其他发展机会,南下某创投公司担任首席计算语言学家(Chief Computatiuonal Linguist),帮助公司设计开发新一代搜索引擎,面向企业市场。

作为资深计算语言学家,我设计并领导开发的自然语言平台 (NLP Platform) 
作为产品技术核心取代了初期产品的内核,使得我们面向互联网的新一代搜索引擎的准确度大幅度提高(查准率提高了3-5倍),深受客户欢迎。CEO把这个变化比喻为从家常菜转变成了专业厨师质量的菜肴,使得我们的产品可以 scale up. 我们的一位财富500强的客户,惊异于我们的搜索结果,评价道:“真是最令人惊叹的产品:诺姆乔姆斯基与比尔盖茨相会了!” 这可以算是对语言学(乔姆斯基是全世界最知名的语言学家,MIT讲座教授)大规模的应用于软件工业界的最高评价了。作为技术创新人员,我对此深感自豪。

具有扎实的语言学背景和多年自然语言处理的实践。在Cymfony/Janya期间,与大学SUNY/Buffalo计算机系和语言学系有密切联系,作为工业导师(industrial advisor),前后指导过两个系的20多个实习生。同时在公司内部,也培训过一批又一批语言处理开发人员和词典人员。

我有中文信息处理和机器翻译的丰富经验和良好训练,得益于汉语形式语法研究的博士课题及此前在中国社会科学院的研究以及当年在中关村的高立英汉机器翻译系统的开发和产品化。在社会科学院语言研究所工作期间,作为技术骨干,在刘倬教授领导下,跟高立公司合作,把机器翻译研究项目成功转化为产品GLMT,该项目获得国内外多项奖项,包括在新加坡INFORMATICS’92国际博览会计算机应用软件银奖。多年来,作为中文信息处理的国际会议和期刊的编辑和审稿人,一直追踪该领域的发展,对这个领域有总体的把握。我认为,中文信息处理面临根本的突破,突破点是研究开发具有鲁棒性和高效的汉语浅层自动分析器 (shallow parser),以此为平台,可以根本上缩小中文处理与西方主要语言处理之间的差距。无论研究还是应用,这都是一个激动人心的研发方向。作为第一个应用,中文舆情挖掘系统已经产品化,服务于财富500强企业客户。

有组织能力和沟通能力,与华尔街投资人,政府项目管理人和企业职业经理人员以及各种不同背景的软件工程师、语言学家和研究人员沟通自如。 



https://blog.sciencenet.cn/blog-362400-295971.html

上一篇:《甜甜花絮:Practice Makes Perfect》
下一篇:C.V. (立委英文履历)
收藏 IP: 99.90.69.*| 热度|

2 陈儒军 魏玉保

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-4 16:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部