科学网

 找回密码
  注册
搜索
热搜: 科学 论文
搜索
AI 正在不声不响渗透我们的生活
李维 2022-7-8 08:04
-- 大数据的神奇脑补:从模糊到逼真 从二维到三维 先说个故事。 几年前,我老爸给我发微信问,有没有办法修复先辈仅存下来的几张旧照片,特别是我的爷爷那一辈。我做了一些尝试,效果并不满意。 这是翻拍的旧照片,我曾插在 我的博客《李老夫子遗墨》专栏 里面: 應文世兄(立委伯祖父遗像) ...
个人分类: 立委科普|847 次阅读|没有评论
RPA 是任务执行器还是数字员工?
李维 2022-5-12 11:04
RPA(Robotic Process Automation) 由于其实用性和领域通用性( 哪个领域哪个企业没有办公室的琐务和流程要做?)成为近年来很火的赛道,它的字面翻译是“机器人流程自动化”,本来比较实在的,反映了其“任务执行器”的本性,后来被翻译(拔高)为“数字员工”或“机器员工”,其实是“托大”了。 白硕老师说得很确切: ...
个人分类: 立委科普|839 次阅读|没有评论
《深层解析符号模型与深度学习预训练模型》(修订文字版)
李维 2022-5-8 02:25
谢谢小编整理成文字,我也做了认真校订与补充(尤其是冷启动低代码部分),欢迎讨论或砸砖。 ​​​ 分享嘉宾:李维博士 NLP scientist 编辑整理:陈昱彤 纽约大学 出品平台:DataFunTalk 导读:NLP (自然语言处理) 技术的深入发展主要有两条路线,第一个是基于符号规则的深度解析模型,第二个是基于 ...
个人分类: 立委科普|617 次阅读|没有评论
NLP 新纪元来临了吗?
李维 2022-5-4 21:34
与曼宁教授合影(2017-07-18) 前一篇博文 推荐Chris Manning 论大模型,并附上相关讨论 。这篇综述对于NLP意义重大,值得反复研读。文章也很好读,写得清晰简练。 有一个有意思的观点,值得介绍。曼宁试图重新做NLP历史划分,从而突出自学习革命的分水岭作用: Inhindsight,thedevelopment&nbs ...
个人分类: 立委科普|894 次阅读|没有评论
推荐Chris Manning 论大模型,并附上相关讨论
李维 2022-5-1 06:37
【立委按】强力推荐。非常好的review。曼宁教授深厚的计算语言学学识反映在他的综述和展望中,具有历史厚度和语言本质的理解深度。最后的那个点也很好:当前的一锅煮的超大模型实际上是一个可行性研究,已经初见成效;将来的大规模的领域场景应用,会召唤相对来说小一些但更加领域数据密集和纯化的基础模型,可以展 ...
个人分类: 立委科普|906 次阅读|没有评论
《我看好超大生成模型的创造前途》
李维 2022-4-30 04:54
最近,盘古群(一个围绕中文超大生成模型盘古的技术交流微信群)里的朋友在谈 open AI 最近发布的 Dalle 应用,吸引了成千上万的人想要先睹为快。据介绍,Dalle 可以根据你的自然语言的描述,随机生成任意图片。从发布的样例看,很多生成的图片超出人的想象,很像艺术品,当然也有次品,但都是唯一的。下面随手摘取几张样 ...
个人分类: 立委科普|1054 次阅读|没有评论
关于NLP 落地以及冷启动的对话
李维 2022-2-7 19:11
友:我比较好奇一个问题,方便的话请教一下李老师。像您开发的那一套parser或者引擎,一旦您离开了,还有人能持续提升么?我个人感觉能有人维护好就不错了。毕竟那套涉及很多语言学的东西,想深入到里面去改进或者维护,应该不容易。 李:基本不能,但是在NLP落地所需要的抽取层面可以继续。就是 NLP-core 一般人不要动。 ...
个人分类: 立委科普|1093 次阅读|没有评论
《李白荀舟詹128:从专名的层次纠缠谈NLP前路漫漫 一缕曙光》
李维 2022-1-10 20:55
舟:新闻标题:“球员明天昨日与爱妻举行婚礼,武汉队官方送上祝福” 如何解析? 白:爱妻一个坑,球员一个坑,武汉队反填球员坑,球员反填爱妻坑。明天做专有名词。什么都能做专有名词,明是一个姓,更能。昨日倒是只能做状语。再加上一个矛盾的时间状语,优先级折损,让专有名词义项露出来。 “明天”本来就是名词,组 ...
个人分类: 立委科普|908 次阅读|没有评论
《李白梁严127:神经的要害在数据瓶颈与定点纠错盲区》
李维 2021-8-9 09:40
李:我觉得,神经的要害在数据瓶颈与定点纠错盲区,而不是非符号化或可解释性。 这几天在琢磨可解释性的问题。可解释性与性能是两码事,道理上,产品讲的是性能,可解释性最多算是客户友好,让人感觉舒服一点而已。(可解释性的基础是与用户共享的符号系统。不共享的符号也不具有可解释性。这就好比我买了个吸尘器,你给 ...
个人分类: 立委科普|1064 次阅读|没有评论
《李白宋121:中文分词歧义及其包容》
李维 2021-6-30 13:15
分词结果应该长什么样? 最新原创出炉,白老师又有佳作,话题是中文“分词”。 李:请教@白硕 ,“线状补丁”列表的遗漏掉的词汇就是一个 list of words?所说的优先级来自何处?优先级本身是不是也表示出来?根据优先级需要 cut 一刀,否则就是 exhaustive tokenization 的查词典全覆盖了,这一刀在哪里截住有说法吗? ...
个人分类: 立委科普|995 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-8-9 04:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部