科学网

 找回密码
  注册
《我看好超大生成模型的创造前途》
李维 2022-4-30 04:54
最近,盘古群(一个围绕中文超大生成模型盘古的技术交流微信群)里的朋友在谈 open AI 最近发布的 Dalle 应用,吸引了成千上万的人想要先睹为快。据介绍,Dalle 可以根据你的自然语言的描述,随机生成任意图片。从发布的样例看,很多生成的图片超出人的想象,很像艺术品,当然也有次品,但都是唯一的。下面随手摘取几张样 ...
个人分类: 立委科普|1933 次阅读|没有评论
关于NLP 落地以及冷启动的对话
李维 2022-2-7 19:11
友:我比较好奇一个问题,方便的话请教一下李老师。像您开发的那一套parser或者引擎,一旦您离开了,还有人能持续提升么?我个人感觉能有人维护好就不错了。毕竟那套涉及很多语言学的东西,想深入到里面去改进或者维护,应该不容易。 李:基本不能,但是在NLP落地所需要的抽取层面可以继续。就是 NLP-core 一般人不要动。 ...
个人分类: 立委科普|2214 次阅读|没有评论
《李白荀舟詹128:从专名的层次纠缠谈NLP前路漫漫 一缕曙光》
李维 2022-1-10 20:55
舟:新闻标题:“球员明天昨日与爱妻举行婚礼,武汉队官方送上祝福” 如何解析? 白:爱妻一个坑,球员一个坑,武汉队反填球员坑,球员反填爱妻坑。明天做专有名词。什么都能做专有名词,明是一个姓,更能。昨日倒是只能做状语。再加上一个矛盾的时间状语,优先级折损,让专有名词义项露出来。 “明天”本来就是名词,组 ...
个人分类: 立委科普|1633 次阅读|没有评论
《李白梁严127:神经的要害在数据瓶颈与定点纠错盲区》
李维 2021-8-9 09:40
李:我觉得,神经的要害在数据瓶颈与定点纠错盲区,而不是非符号化或可解释性。 这几天在琢磨可解释性的问题。可解释性与性能是两码事,道理上,产品讲的是性能,可解释性最多算是客户友好,让人感觉舒服一点而已。(可解释性的基础是与用户共享的符号系统。不共享的符号也不具有可解释性。这就好比我买了个吸尘器,你给 ...
个人分类: 立委科普|1918 次阅读|没有评论
《李白宋121:中文分词歧义及其包容》
李维 2021-6-30 13:15
分词结果应该长什么样? 最新原创出炉,白老师又有佳作,话题是中文“分词”。 李:请教@白硕 ,“线状补丁”列表的遗漏掉的词汇就是一个 list of words?所说的优先级来自何处?优先级本身是不是也表示出来?根据优先级需要 cut 一刀,否则就是 exhaustive tokenization 的查词典全覆盖了,这一刀在哪里截住有说法吗? ...
个人分类: 立委科普|1812 次阅读|没有评论
【世界语《第二书》的自动解析笔记】
李维 2020-9-14 01:33
作为周末爱好,最近把 Esperanto parser (世界语自动句法解析器) 复活了。为“自然”语言做的平台,对于“人造”语言扫描,那的确是”降维打击“,就跟美国轰炸伊拉克似的。先找一个简单的句子热身: 世界语《第一书》略显简单,咱们从《第二书》开始认真试试庖丁牛刀,LOL。 la unua frazo en 《La Dua Libro》: ...
个人分类: 立委科普|4596 次阅读|没有评论
《AI 理性主义的终结是不可能的吗》
李维 2020-7-20 14:23
这注定是一本小众冷书。但愿所传承创新的符号自然语言学术,丝相连、藕不断。有如人工智能理性主义的潮起潮落,庶几留下一声历史的回响。谁知道呢,五十年河西,“神经”恐非历史的终结。钟摆回摆的时节,历史或被重新发现。摘自《写在NLP小书出版之时》 宋:@wei 祝贺立委心血之作付梓!做科学,真知灼见;讲科学,深入 ...
个人分类: 立委科普|3622 次阅读|没有评论
《李白宋118:多层处理为 heuristics 的实现提供了广阔空间 》
李维 2020-1-10 22:51
白:“老师批评的是我” 问题:升格以后的空范畴,具备建立Hidden links的资格吗?看图上,填“老师”名词坑的应该是“我”才对。填空范畴总有点那个。 李:最终应该得出SVO 才对:老师/S – 批评/V – 我/O, 不管用什么中间links和手段, 因为人的理解如此。其实从 pattern 角度,通向最终目标的路径还是蛮清晰 。 ...
个人分类: 立委科普|2502 次阅读|没有评论
《李白王116:句法的脑补,情报的冤家(2/2)》
李维 2019-7-21 13:37
李:@宋柔 老师说了不少我正想说的话 I cannot agree more,譬如: “当然。我完全同意语义的重要性,只是觉得词汇语义+事理常识+专业知识,实在是无边无际,难以控制。某个句子可以采用某种语义关系加以解释,但可选用的语义关系非常多,机器怎么就能选对了语义关系进而做出正确的解释?大数据并非万能。所以,挖掘句法 ...
个人分类: 立委科普|2983 次阅读|没有评论
《李白刘114:围着白老师沙龙聊点文字学问》
热度 1 李维 2019-7-9 10:17
立委按:白沙龙是个神奇的所在 / 感觉有点像围着火炉吃西瓜 / 有一搭没一搭 /貌似漫不经心 / 不时闪现火花。原来 学问也可以是聊出来的。 白:“包里揣着自行车座的天津人”,有伪歧义,但可以干掉。人揣不进包里,size不匹配,包装方式也不人道。人成为被自行车座领属的对象,组合也怪异。 李:Vt + N1 + de + N2 s ...
个人分类: 立委科普|3181 次阅读|1 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-21 01:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部