||
吕乃基
ChatGPT掀起轩然大波,不仅在业界,而且在全社会。
本文是博主关于ChatGPT已发的四个部分(五篇)之合集,做了补充和修改,侧重于从产业的角度理解,是为“上”。“ChatGPT管窥(下)”将试图扩展到社会层面。
一、横空出世——自由探索精神+科技公司+资本
1.“生成式”创新
OpenAI在本世纪第二个十年间已经创建了全世界最强大的大语言模型之一,GPT-3,但很难准确提供用户想要的结果。一个团队提议使用“强化学习”系统完善该模型。“强化学习”是从试错中学习以取得最大化回报的人工智能系统。以人类对话的形式持续提供反馈,使人工智能软件很容易知道其做得好的地方和需要改进的情况。这就是后来的ChatGPT。
AI分成两类:“分析型AI”,分析已经存在的东西,和“生成式AI”,生成新的东西,二者并无截然分明的界限。ChatGPT当然也需要分析,但其运行和功能的核心属于后者,属于内容生成型人工智能(AIGC,AI-Generated Content)。当预训练模型的规模达到一定规模,就会发生“涌现”,GPT 实现智能上的飞跃。ChatGPT发布后用户暴增,OpenAI表示,虽然对服务器的压力,会增加计算成本,然而这些用户提供了宝贵的数据和反馈意见,更高效地训练聊天机器人的反应。这便是“生成式”的题中应有之义。
开发完成后,OpenAI邀请贝塔测试人员对其进行了测试。反馈却令OpenAI失望;人们不知道该与聊天机器人交流哪些内容。OpenAI一度尝试开发专业聊天机器人,为特定领域的专业人员提供协助。但是OpenAI缺少训练专业聊天机器人的合适数据。
OpenAI成立时,业内主流人工智能路线是“监督式深度学习”,需要人工将语义、图片打上标注,机器才可以识别相似信息,典型的应用场景是客服回答与直播鉴黄。但OpenAI选择的“非监督强化学习”技术路线,是将巨大的语料库不经标注地直接投进模型,等待机器吐出一个未知的结果。由此可以联想到半个多世纪前合成具有生命活力的结晶牛胰岛素。在两条长链好不容易成功合成后,科学家准备面对更难的一步:拼接两条长链,并卷曲成胰岛素的立体结构。没想到这一过程自动发生,生成了具有生命活力的结晶牛胰岛素。
经费在燃烧,结果却无从预料,这种九死一生的创新模式,成了大多数公司无法承受之重。https://mp.weixin.qq.com/s/FG9Y3x-Rpy8Gw-dWAwWqDA
OpenAI决定孤注一掷,对外发布ChatGPT,交给用户使用,任其自由发展。布洛克曼表示:“我承认,我当时的立场是,不知道它是否会成功。”
许多过往无机会接触AI的人,突然零距离见证了AI的能力,对AI的功能赞叹不已,同时又感受到AI对人类工作带来的威胁,充满矛盾和混乱的心情。
ChatGPT的突然爆红,令公司措手不及。其首席技术官米拉·穆拉蒂表示:“这令我们非常惊讶。”在旧金山召开的风险投资活动上,阿尔特曼表示他的“预期可能要低一个量级——它所引起的热度低一个量级。”
在上述过程中可见供给与需求对接之难。开发人员做不到精准想用户之所想,或者知道却又一时在数据或技术上欠缺;反过来,用户也不知道该与聊天机器人交流哪些内容,甚至不知自己的需求究竟是什么。结果是发布了再说,交给用户使用,让供需双方在试探中对接。
开发方非精心策划,而是“走着瞧”,“不知道它是否会成功”,而用户,特别是大量未设定“计划外”的用户,“突然零距离见证了AI的能力”,潜在而模糊的需求清晰起来成为现实,同时又喜忧参半。
2个月的爆炸式增长表明供需双方高度“投缘”,然而时间过短,领域过广,因此也会留下相当长的磨合过程。
ChatGPT不只是“生成式AI”,而且也是“生成式”创新。
2.ChatGPT乃市场竞争之果
本来在业内人士看来,神经网络初创公司DeepMind是有极高胜算最先开发出通用人工智能的公司。如果DeepMind成功,谷歌可能会在这项无所不能的技术领域一家独大。OpenAI成立的一个原因是避免谷歌在人工智能领域的垄断。
OpenAI的GPT-3在2020 年发布后,OpenAI 原计划为发布 GPT-4 而努力,并几乎已准备就绪。
但是,据知情人士说,由于担心对手公司可能会在 GPT-4 之前发布他们的人工智能聊天机器人,OpenAI 决定成立一家实验室与其竞争,通过改进GPT-3 来收集反馈意见,进而改进新的模型。13 天后,ChatGPT 便诞生了。(详细请见https://blog.sciencenet.cn/home.php?mod=space )
谷歌之所以起了个大早,赶了个晚集,还是因为“声誉风险”(待后续)而在战略布局上太过谨慎。
谷歌正在测试暂定名为“学徒巴德”(Apprentice Bard)的聊天机器人,Bard可从网络上获取最新信息来提供新鲜、高质量的回复,这意味着它可能能够回答有关近期事件的问题,而这正是ChatGPT的短板。打破垄断,反过来也一样。相比ChatGPT,谷歌投资的Anthropic 强调其构建“可靠、可解释和可操纵的人工智能系统”。
不同于相对自由的科学研究,ChatGPT的问世,清晰可见外部竞争对于企业的运行造成在时间上的压力和曲折的路径选择。
在发展的不同阶段,企业的运行是自由至上还是瞄准产品有不同的权重。ChatGPT的襁褓阶段在某种程度上还处于混沌状态,不知长大会怎么样,更不知长大做什么;犹如大河之源头,溪流几乎在原地兜兜转转,不知往何处流。一旦显示出某一方面的能力,某一条溪流开始占优,进而与社会的需求、与大海隐约相通,那么资源将集中到这一能力,其他支流在一定程度上失去自己的“自由”而汇入干流之中。固然,也有临入海仍摇摆不定的事例,譬如黄河,不过那是灾难。
微软发布AI加持的新必应之后,必应在全球的下载量猛增了十倍。
最新的情况是,2月7日,谷歌的新人工智能工具Bard犯了事实性错误,这加剧了人们对相关工具尚未准备好集成到搜索引擎中的担忧,导致次日股价大跌7.4%,市值蒸发近7000亿。在相当程度上,失误当归咎于竞争的压力,忙中出错,欲速则不达。由此表明,道路虽然曲折,虽然偶然,以及容许失败,还是不能逾越容错的边界,尤其是不能一错再错,先是过于谨慎,继而仓促上马。
一家独大时保持紧迫感,对手迫近时保持冷静。然而知易行难。
有媒体指,这一次的人工智能巅峰对决,是微软和谷歌的对决,也就是两个印度人之间的竞争。前一句合题,后一句是半开玩笑。2014年和2015年,萨提亚·纳德拉(Satya Nadella)和皮查伊两位印度移民先后接管了全球最大的两家互联网巨头微软和谷歌。纳德拉以“富有同理心”闻名,上任后成功改变微软的企业文化;皮查伊为人内敛,观察、协调的能力却很突出,深谙掌握人心的技巧。
市场中合规的竞争是科技发展之道,竞争正未有穷期。
顺便提及,有一位硅谷精英没有继续在OpenAI董事会任职,他就是马斯克:2018年,马斯克离开OpenAI董事会,理由既在于需要经营SpaceX,还有更重要的特斯拉。另有媒体称,是为了“消除潜在的未来冲突”,特斯拉专注于无人驾驶AI,在人才方面存在竞争关系。
二、有“特色”的资本
着眼下一个革命性技术研究的微软研究院,更多专注于研发本身,而对商业价值置若罔闻,因此其取得的研究突破并不易直接商用。
正当纳德拉为微软在AI方面的滞后而愁眉难展,一个千载难逢的机会摆在了他的面前——成立短短几年就开发出诸多复杂AI工具的OpenAI,正在寻找融资机会。
微软2019年给OpenAI投资了10亿美元,2020年买断了GPT-3背后基础技术的独家许可,从此与OpenAI建立了日益深厚的关系,并换来相当多的优待,包括OpenAI大部分技术用于Bing搜索引擎等产品的优先授权,以及Azure云平台成为OpenAI的独家云供应商。
OpenAI也越来越离不开微软的软件和硬件,数据和算力等方面的支持。
真正潜藏的巨大价值在于ChatGPT在短期内聚集的庞大用户,数百万用户的试用反馈将OpenAI的先发优势如同滚雪球般越滚越大,促使它成为ChatGPT类产品的规则制定者。
微软将在该公司追加投资100亿美元。OpenAI和微软都认为,曾经的非营利性实验室现在已经有可用来出售谋利的产品。
此处关键的一点是,资本来自业内的投资方,微软。其一,投资方懂行,深知利弊,“利”是广阔的发展空间和滚滚而来的收益,“弊”为可能的风险。其二,投资而不是收购,在相当程度上被投资方保留了独立性,与投资方具有“必要的张力”,双方在短期内就可以完成与自身原有业务的整合,在技术上互相支撑。其三,通常的A轮投资方来自业外,只能祈求具有“天使”般的勇气、慈善,还有财力。再者,业内的投资还可以避免风投公司基于“傻瓜理论模型”的炒作。
当然,天使翱翔于云际,不会直接干预投资对象的实际运行,也没有能力判断其是耶非耶;微软虽不是收购,也将在相当程度上把OpenAI纳入自己的战略之中。
一方是树大根深然而步履略显迟缓的业内大厂,另一方是握有面向未来利器血气方刚的初创公司,双方优势互补,需求互补。更重要的是,双方的理念相投,目标相近。
在此案例中,资本的运作也颇有特点。2019年,OpenAI宣布重组为一家“有限盈利(capped-profit)企业”,并接受了微软10亿美元的投资。对此,标准的“ChatGPT式”回答(以后这可能会成为一个习惯用语)是:
“有限利润”,也称为“利润上限”,是一个术语,指的是对公司可以赚取的利润的限制。这种类型的限制通常是由监管机构或政府施加的,这些行业的服务或产品的提供被认为是公共产品,或者产品或服务的价格受政府监管。作为OpenAI开发和拥有的AI语言模型,我不是一家公司,也没有传统意义上的盈利能力,也不产生传统意义上的利润。我在OpenAI的创建者可能会对我的使用方式或我要执行的任务类型设置限制,但这些限制与利润无关。相反,它们是为了确保我以负责任和有道德的方式被使用,并且不会用我干坏事。
“有限盈利”商业模式旨在确保公司的重点,是服务客户和为更大的利益做出贡献,而不是利润最大化。这其实就是“社会企业(Social Enterprise)”。
OpanAI接受了硅谷一众大佬和微软的巨额投资,但其股权结构却设置了一个逐渐退出的机制。
随着OpanAI逐渐盈利,在它渐次满足硅谷投资人、微软、创世团队和员工之后,在总利润达到1500亿美元后,这家企业将会成为一家非盈利机构。回到初心,将人工智能的效益公益化、普惠化。这本身是个伟大的创举。
https://mp.weixin.qq.com/s/afNTGW3CO24MMC1QliuNIw
谷歌目前在搜索市场占据主导地位,其全球市场份额超过90%。必应虽然名列第二,市场份额仅有约3%。微软将ChatGPT整合到必应,使其能够为用户反馈简洁明了的回答,并且使用户可以通过与聊天机器人对话进行深入探究,而不是逐一查看一列链接。对于微软来说,是时候动摇谷歌的霸主地位了。
按照微软的标准,这些积极的回报非常划算。微软在OpenAI的总投资额为130亿美元,确实是一个天文数字,但这笔投资仅占其过去12个月850亿美元税前利润的15%,却能获得一项颠覆性技术的近期控制权,是一笔成本相对较低的交易。“ChatGPT的重要性堪比个人电脑或互联网”,比尔·盖茨如此表示。
周鸿祎指出ChatGPT背后的3点关键因素。首先是大型企业+科研机构协同创新,微软在协同创新中发挥了大型科技企业在资本、技术和商业化等方面的优势,OpenAI专注于相对自由的学术研究,两方优势互补,共同支撑了这一重大技术创新。其次是基于开源和众包的开放创新模式,开源也促进了整个产业的共同发展。第三是以通用大模型为中心的生态创新模式,目前引用ChatGPT开放接口的应用已多达上千个,各类问答、代码生成、内容创作等新应用不断涌现,产业生态快速发展。
三、巨量需求在短期如海啸般涌入,难道不是最大的伦理?
1.OpenAI远去的承诺
一开始,OpenAI的新实验室旨在成为一家与DeepMind和谷歌截然不同非营利性质的机构,明确提出以将先进人工智能的效益民主化为使命,承诺公开所有研究,将所有技术开源,公司名称OpenAI也充分体现了对透明度的承诺。这些承诺与人类的价值观相一致。Open AI自成立之初,就致力于打造安全和通用AI的能力,并坚定的持续投入,这是ChatGPT成功的一大关键因素。在这样的愿景下,吸引了一大批高水平的人才,在没有任何商业KPI(关键绩效指标(Key Performance Indicator)的情况下心无旁骛地开展研发工作,最终取得了重大突破。
然而,训练庞大的神经网络成本高昂。几年后,阿尔特曼和OpenAI的其他人得出的结论是,要与谷歌、Meta以及其他科技巨头竞争,该实验室不能继续以非营利的方式运营。一旦沿着一开始设定的目标和路线进行科研研究,要取得突破,所需要消耗的计算资源每 3~4 个月要翻一倍,这就要求在资金上对这种指数增长进行匹配,而 OpenAI 当时非盈利性质的限制,还远远没达到自我造血的程度。阿尔特曼的一句名言:不要问我赚钱的问题,我怎么知道。然而在2019年,阿尔特曼对《连线》(Wired)杂志表示:“为了成功完成我们的使命,我们需要海量资金,数额远超出我最初的设想。”
随后的发展是,OpenAI从一家研究实验室变成价值数十亿美元的现象级企业,然而实现科学驱动的宏大想法的承诺正在远去。这也意味着,未来的GPT版本和后续的技术成果都将不再开源。OpenAI要让微软收回全部投资需要相当长的时间,这也就意味着其研发能力会被微软锁定相当长的时间。
一位前员工表示:而今“公司所关注的重点更多地倾向于如何开发产品,而不是努力回答最有趣的问题。”公司在策略和文化上的转变,是OpenAI前研究副总裁Dario Amodei带着10名员工(其中许多人从事人工智能安全工作)在2021年决定离开公司并成立研究实验室Anthropic的原因之一。其推出的 Claude 是 ChatGPT 的一个强有力的竞争对手,在许多方面都有所改进。Anthropic已得到来自谷歌的投资。
其实上述困境的解决之途也很简单,那就是米开朗琪罗的名言,上帝的归上帝,凯撒的归凯撒。员工未必由长江头一直跟到长江尾,从1干到到100。喜欢自由的留在三江源,面向实际的下沉到面向各类用户的市场。产业链上流动的是不同形态的产品。前文已述及,随着OpanAI逐渐盈利,在它渐次满足各方投资人、创世团队和员工之后,这家企业将回到初心。
2.谷歌的“声誉风险”和被解雇的伦理学家
“声誉风险”,指AI模型的训练数据集来自网络,因而容易让AI语言模型产生错误信息的幻觉,表现出种族和性别偏见,并且重复仇恨性语言。
像谷歌和Meta这样的大厂,产品影响着太多用户,对每一步举动都会思虑再三,策略自然不会像OpenAI这样的小初创公司一样灵活。Google所有在研的人工智能模型都禁止生成真实人物的图像,这对预防深度伪造(deep fake)将起到一定作用。谷歌AI负责人Jeff Dean此前曾告诉员工,谷歌有能力做出媲美ChatGPT的产品,之所以迟迟不愿发布,是因为担心这类产品会因提供错误信息等缺陷而影响公司商誉。
成也声誉风险,败也声誉风险。谷歌陷入“创新者的困境”:成熟公司很难让采用破坏传统市场的新技术或商业模式。当更小、更敏捷,较少束缚的竞争对手进入市场,或许最终会导致成熟大公司的消亡。
2020年,谷歌的人工智能道德专家主张要谨慎使用文本生成技术,有些高管被激怒,两位著名的人工智能道德专家Timnit Gebru和Margaret Mitchell被解雇。ChatGPT获得的关注激增后,也给Meta和谷歌之类的科技巨头造成了压力,让他们不再那么顾虑安全问题。随着谷歌和Meta这样的大厂开始争相追赶OpenAI,曾经那些批评家和伦理学家们,也会越来越受冷遇。
而LaMD背后的研究人员也对谷歌的犹豫感到沮丧。眼看着手中的技术耽搁几年都无法投入市场,他们中的许多人纷纷离开公司,用同样的技术建起了初创公司。谷歌https://mp.weixin.qq.com/s/N-xeYFF4uJHtzfR6PqsotQ
然而随即也被卷入与微软乃至更大规模的竞争之中。
3. 知识产权
人工智能专家表示,如果法院判决原告胜诉,可能会阻碍生成式人工智能的繁荣:大多数生成式人工智能模型都是使用从互联网上搜刮的材料进行训练,并没有取得许可或支付报酬。海量文本数据集正在成为一般的知识生产要素,在内容审核方面应适当放宽,使其更充分地发挥知识生产的潜能(段伟文)。
在上述事例中,充分可见伦理,在一定程度上还有法律等,面对科技突破和市场海啸时的软弱与滞后。如果有一家公司的产品在市场上获得特别是方向性的突破,就会对其他公司,尤其是大厂,构成巨大的压力,跟着轻易突破往日的禁忌。
与生成式人工智能、chatGPT和创新的“生成”一样,伦理和法律也应处于持续试探的“生成”过程中,而不是一次性,更不是事先的判决,拿以往的观点和条文去束缚生成中的创新。
庞俊来博士认为,人类文明的下一个方向应该是知识产权革命。知识产权的保护,在特定时空范围和领域有其价值,然而让人类丧失大量可贵的资源与人力去从事重复性劳动,甚至成为相互抵制的政治筹码。知识普遍性如何突破民族与国家界限,期待社会文明制度的革新。
对此,ChatGPT自己的回答是,诚然,人工智能领域在技术上很复杂,而且发展迅速,这可能使建立明确的人工智能治理规则、标准和指南成为挑战。然而,这并不意味着这种规则、标准和指南是不可能的,也是不必要的。相反,可能有必要以灵活和可适应的方式处理这些框架的发展,并认识到随着我们对人工智能及其影响的理解的发展,它们可能需要被修订和更新。
科技突破,资本强势介入,此时此刻,任何往日的伦理禁忌黯然失色。说到底,巨量需求在短期甚至瞬间如海啸般涌入,难道不是最大的伦理?
实际上,伦理等人文社科并不是“挡住”科技发展的步伐,而是在科技的发展及其成果中,实际上已然融入了人文的因素。参见:科学文化与人文文化的边界及其推移(合集)https://blog.sciencenet.cn/home.php?mod=space&uid=210844&do=blog&id=1372558
chatGPT,难道只是科技?
四、“技术爆炸”与“纵横交错”
1.技术爆炸
技术爆炸,是《三体》中众多炙手可热的词汇之一,放到ChatGPT问世后,从供给侧到需求侧,从业界、商界到普罗大众所掀起的应用和再创造,以及同行之间展开竞争热潮,恰如其分。只是“爆炸”的不仅是技术。
“我一生中从未见过,至少在我从事科技行业的30年中,发生在美国西海岸的先进科技在几个月内就以非常真实的方式出现在印度农村的某个人身上。”微软首席执行官萨蒂亚·纳德拉(Satya Nadella)感叹,“这是我从未见过的技术扩散。”
短短两个月,人们源源不绝地挖掘ChatGPT的更多技能,包括替写代码、作业、论文、演讲稿、活动策划、广告文案、电影剧本等各类文本,或是给予家装设计、编程调试、人生规划等建议。
在chatGPT出现之前,人工智能大多是针对特定的场景应用进行训练,生成的模型难以迁移到其他应用,属于“小模型”范畴。整个过程不仅需要大量的手工调参,还需要给机器喂养海量的标注数据,这拉低了人工智能的研发效率,且成本较高。只能应对有限特殊的领域,不能迁移,更不能适用于普遍的场景,这是业界对人工智能现状的一大诟病。
大模型通常是在无标注的大数据集上,采用自监督学习的方法进行训练。之后,在其他场景的应用中,开发者只需要对模型进行微调,或采用少量数据进行二次训练, 就可以满足新应用场景的需要。这意味着,对大模型的改进可以让众多小模型受益,大幅提升人工智能的适用场景和研发效率,因此大模型成为业界重点投入的方向。OpenAI GPT 3 大模型在翻译、问答、内容生成等领域的不俗表现,让业界看到了达成通用人工智能的希望。当前ChatGPT的版本为GPT 3.5,是在GPT3之上的调优,能力进一步增强。
https://mp.weixin.qq.com/s/JuWvzlrt0mnaZZubt133OA
大模型及其带来的普适性,是技术之所以“爆炸”的依据。
2.在“纵”与“横”的交叉点上
360董秘表示,“在此之前,大家对于能用通用AI来做专业的事情心里是没有根的,大家更多做垂直领域或者更专业的AI,用更专业的数据模型去训练人工智能,去做一些专业领域的事情。”
这位董秘说到了“垂直”,多位业内人士在不同场合也都用到了这个词汇。
产业可以有各种分类,如一二三产等,“纵横”也是一种分类。“纵”,就是垂直,指二产特别是制造业的大部分行业,大多有从源头到终端用户上下游的产业链,或者说由1-100众多环节构成。“横”,包括没有或较少加工,直接面向众多用户的行业,如能源和交通运输业等。上世纪后期出现的互联网孕育了一众互联网巨头,作为“平台”,服务于各行各业,也可以归入“横”的一类。不过,横,不是一维的线,也不是二维的面,而是三维的体,拥有自身的技术层次,因而是有厚度的面,故曰“平台”。
芯片业显然属于制造业,却与一般制造业的“垂直”有所不同,芯片产业链的上下游短。芯片作为各行各业的基础,更是一种“横向”的底层技术,应用于各类或纵或横的行业。其他行业就像“长”在芯片上的植株,垂直于横向的芯片业。如果有什么行业如今还没用到芯片,那是因为该行业尚未成熟;正如马克思论及数学在科学中的地位和作用一样。
chatGPT横空出世,支持更多垂直领域,“垂直”一词,道出了chatGPT本身的“横向性”。不同于互联网平台,后者所起的主要是沟通和互联,而chatGPT起到如芯片在360行的作用,数学在科学中的作用,是一种基础和普适的横向性。
可以说在一切按某种目的,需要收集、比较、转换和汇总当下知识、图像、音频和视频,进而加以分析、综合与展望的事项和领域,ChatGPT都可以大有作为。ChatGPT增强了大模型的指令学习能力和用户意图捕获能力,解锁了大模型的泛化能力。从互联网层面看,可以作为信息入口,与搜索引擎相结合;从文案办公方面看,可以与办公软件相结合,增强人的办公效率;从人机交互角度看,体现的是一种基于语言的自然交互方式,可以与元宇宙、数字人结合(https://mp.weixin.qq.com/s/e80KkImLG-Llak2VRUeDkg)。
chatGPT大致由3层组成。底层是预训练模型的技术基础设施。由于预训练模型的高成本和技术投入,具有较高的进入门槛。
中间层,即垂直化、定制化、场景化、个性化的模型和应用工具,实现在不同行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。
应用层,面向C端用户的文字、图片、音视频等内容生成服务,最终和用户的需求无缝衔接起来实现产业落地。
底层、中间层和应用层三层表明,“横”的ChatGPT有自身的厚度,不是二维的面,而是三维的体。
“ChatGPT人工智能的发展,现在所缺的是怎么跟行业更紧密的结合。”邬贺铨院士说。一方面,从事人工智能技术开发的企业不了解产业需求,另一方面,实体产业的专家没有那么高的水平开发类似ChatGPT这种大模型。金融、汽车、消费等各个领域都需要契合行业的模型。
“横”着的chatGPT不需要“精准的”市场定位,chatGPT的普适性对用户来者不拒;前来“接种”的形形色色的用户发现,横置而开阔的chatGPT总有一款经场景化改造适合于我。各垂直的行业纷至沓来,先在宽阔普适的“面”寻找立足点,继而在有厚度的ChatGPT扎根生长,省去很多训练模型的成本。垂直公司的业务场景向下在大模型扎根,汲取营养,溯源基础,利用ChatGPT进行创新;进行更偏自身业务属性的微调,向上为客户提供价值增量。反过来,垂直行业也就搅动了chatGPT,从体验、问题、资金和数据等方面反哺chatGPT,使之更为丰富而适应和回应多样化的问题和需求,从而构成纵横之间的良性循环。“纵横”之接口,是这一商业模式的关键。
譬如游戏产业,坐拥30亿玩家、拥有近2000亿美元总产值的大盘子,与chatGPT结合而腾飞。业内人士特别关注到ChatG-PT对代码写作和内容创作的重要性,作为一种生产力工具,能够提高内容产量。游戏业反过来帮助chatGPT乃至生成式人工智能克服缺资金、缺人气的“死亡之谷”难题。。
未来的数年到数十年内,“接种”到chatGPT的行业、机构,各个细分的专业部门和用户,都可以将chatGPT整合到自己的产品和服务当中。包括生成应用和布局、搜索和数据分析、程序生成和分析、文本生成、内容创作,以及一般推理等领域。
在chatGPT加持之后,所有相关领域大致将经历“科研、算力、基础架构、工程、数据、解决方案”这个循环(或其中的若干环节)的快速迭代,凸显流动性和创新性,并形成高潮。往往新成果尚未稳定成形,更新的设想和可能性已接踵而来。以致“很难等到科技封装好,把这些知识全部屏蔽掉(黑箱化,参见:科技黑箱——技术知识的存在方式),再去打磨产品”。未来在竞争中获胜的,将是很好地“解决了产品化和科研及工程创新之间平衡”的团队。团队需要更好的接纳和消化这种“流动性”或“过程性”。
“你在使用第一版演示版的时候,会产生一种非常深刻的反应:‘哇,真是不可思议,我已经迫不及待了’。但在用过一百次之后,你就会发现它的缺点。”OpenAI联合创始人兼首席执行官山姆·阿尔特曼(Sam Altman)实话实说。
显然,chatGPT产业哲学的关键是“纵”与“横”的接口。是否会有更多行业和更多人来用“100次”,以及发现缺点后,chatGPT能否及时改进。商业化整体仍处于起步阶段,部分文本、图像等生成的公司主要以辅助生成内容服务为主,还未全面进入到单一产品的市场化和商业化阶段,尽管有部分公司已经进入AIGC开发阶段,但也还处在免费试用、获取流量阶段。
可以接轨的不仅是公司、机构,还有个人。
语音搜索应用“出门问问”的创始人李志飞表示,“ChatGPT为AI行业带来了一种新的商业模式可能性。此前,AI企业的收费模式更多的是To B收费制,可复制性差,缺乏网络规模效应,边际成本不可控。但ChatGPT的出现,让人们看到了AI技术直接赋能C消费者的可能性,通过给中小企业或个人提供AI工具或服务,也可能获得认可并取得收益。”
另一种情况是,不是直接应用chatGPT,而是借鉴其思路。
产业互联网因用户的特殊性和场景的多样性而成本高企,难以有规模效益,令服务商止步,如果将这种生成式的AI技术应用在工业领域,是否能够深度挖掘数据价值,为工业智能化带来更多便利,有可能掀起一场更为深刻的“工业革命”。
以“工业知识+AI交互(类似于chatGPT)”的融合模式具备更强的专业性和准确性。一方面,由工业领域图谱、行业标准、专利、专用词典等集成起来的大型数据库和机理模型,提供了强大的底层支撑;另一方面则是基于AI技术形成的大规模预训练语言模型的应用,两者结合共同形成了“工业AI”的“最强大脑”,让智慧问答更精准、更专业、体验更强。
https://mp.weixin.qq.com/s/lkYhjPAMZGlZKEHkmLUqLg
ProGen的工作方式也与ChatGPT很类似。ProGen通过学习氨基酸如何组合成2.8亿个现有蛋白质的语法,学会了如何生成新的蛋白质。
近水楼台先“得月”,先对业内开刀。微软CEO纳德拉表示,在全部产品全线整合ChatGPT,当然也包括Bing(必应)。与此同时,微软公司宣布,将在2023财年第三季度大规模裁减1万个工作岗位。竞争对手各谷歌的裁员是1万2。
微软可能会将ChatGPT整合到Word、PowerPoint、Outlook等应用程序中,此举可能会改变数以亿计人的工作方式。
海啸迅速波及业内其他领域,大厂纷纷逃离XR元宇宙。
微软刚成立四个月的工业元宇宙团队(Industrial Metaverse Core)已完全解散,该团队百名成员被解雇。Meta旗下的类Roblox元宇宙游戏平台Crayta宣布将于2023年3月3日关停。
库克表示:“我一直认为人们了解某样事物是什么很重要。我真的不确定普通人能明白什么是元宇宙。”他指出,苹果公司在很大程度上避免使用元宇宙这个词。2月16日下午,有消息称,腾讯宣布部分解散XR(扩展现实)团队。此时距离XR业务线成立,不到8个月。
曾经大热的元宇宙或将陷入死亡之谷,这次主要不是自己的技术不过关,而是chatGPT的光辉太盛,此消彼长。强光光圈之外,一片漆黑。关键是chatGPT脚踏实地,切实解决问题,而元宇宙在相当程度上还是悬在空中的概念。而把“元宇宙”作为新GDP增长的中国许多省市也将受此影响,包括各地诸多“元宇宙”产业园区等等。既然是因为chatGPT的“强光”所致,也就意味着元宇宙自身未必一蹶不振,而是仍有发展前景。元宇宙概念本身模糊不清,既是发展的硬伤,又蕴含着发展的空间。实际上,chatGPT的发展也将有助于支撑、充实和推进元宇宙。
3.发散,还是收敛?
一片叫好声中,ChatGPT仍然面临科技和伦理的诸多挑战,有大量评述,此处仅稍提及。
目前大模型的算力消耗非常庞大,训练大模型消耗的计算量,每3、4个月翻一倍。要实现大规模真实场景应用,模型轻量化技术需要进一步探索;另类摩尔定律呼之欲出。
https://mp.weixin.qq.com/s/e80KkImLG-Llak2VRUeDkg深度
中科大校友认为,OpenAI是大规模暴力预测模型加prompt。这种差别的原因是OpenAI非常执着的追求AGI,属于大力出奇迹,但这并不代表OpenAI一定比Google更先进。https://mp.weixin.qq.com/s/XxGSmdDLRJNKlxBtHzXxnw
GPT-4可能是第一个以稀疏(联系阿法狗的“暴力”,通过蛮力搜索到最优解,以及“价值”,《用深度神经网络和树搜索掌握围棋游戏》)为核心的大型AI模型。稀疏模型使用条件计算来降低计算成本——并非AI模型中的所有神经元在任何给定时间都处于活动状态。该模型可以轻松扩展到超过万亿个参数而不会产生高昂的计算成本。稀疏模型还可以更好地理解上下文——它们可以根据用户提供的内容保留更多的“下一个单词/句子”选择。因此,稀疏模型比它们的前辈更类似于实际的人类思维。大模型的效果虽然令人惊艳,但李笛认为,通过将其拆解为更小、更轻量的步骤训练,依然能达到殊途同归的效果。
Meta也不甘寂寞,反过来介入生成式人工智能,最新成果是,仅用约1/10的参数规模,实现了匹敌OpenAI GPT-3、DeepMind Chinchilla、谷歌PaLM等主流大模型的性能表现。有朝一日,也许能在笔记本电脑乃至手机上跑类ChatGPT功能的语言模型。可以联想到从大型机到个人电脑到手机的过程。LLaMA模型和权重开源开放。
高速发展的生成式人工智能和剧烈的竞争,也对芯片等硬件提出更高要求。ChatGPT 类人工智能需要更充足的算力支持其处理数据。英伟达表示,GPT-3 需要 512 颗 V100 显卡训练 7 个月,或者 1024 颗 A100 芯片训练一个月。2012 年以来,AI 训练任务中的算力增长(所需算力每 3.5 月翻一倍)已经超越摩尔定律(晶体管数量每 18 月翻一倍)
近年来,在IT业,竞争初期领先一步,因用户习惯,沉淀成本,用户之间以共同的版本(标准)沟通和交流,软件商跟风追捧形成生态,可能步步领先,最终形成垄断和某种“中心化”。目前看来,虽然chatGPT似乎先行一步,但缺陷也暴露在光天化日之下,先克服缺陷者依然有机会后来居上。领先且一时无可挑剔,会迅速收敛而走向垄断,有利于领先的公司而不利于市场;领先而存在缺陷,会继续震荡,领先公司不能松气而市场充满活力。围绕chatGPT的竞争方兴未艾。
山姆·阿尔特曼谈论AIGC未来的商业化前景时提到四个方面:(1)API接口开放的To B业务,包括客服工作助手等等;(2)颠覆过往逻辑的“超联想”搜索产品,完成所有想象中的制作;(3)垂直的专业性服务,最大程度磨灭信息不对称导致的供需不平等问题;(4)面向C端的休闲娱乐、人机互动和大众工具的载体。阿尔特曼的新版摩尔定律是,宇宙中的智能数量每18个月翻一番。
还有业内人士提及与区块链结合AI提高效率,区块链确保知识的真实,产权归属,人际公平。
以下面的两个等式作为本文的小结。
chatGPT=自由探索精神+科技公司+资本
技术爆炸+纵横交错=商业模式
请注意两点。
其一,自由探索精神建立于虽非充分但基本必要的科技基础上;资本早期介入,支撑自由探索;自由探索引领投资方向,不是具体的技术路线,而是为人类的未来,为此,可以承担失败、夭折和此路不通的风险。
360董秘的一句话可以资对比。“在此之前,大家对于能用通用AI来做专业的事情心里是没有根的,大家更多做垂直领域或者更专业的AI,用更专业的数据模型去训练人工智能,去做一些专业领域的事情。”“心里没有根”,一言道出此间业界的心理状态。他人做过了,最后成功了,“大家”就一拥而上,
其二,商业模式于创新的后期浮现,或者说“涌现”。此间的投资方往往在研究的初创阶段就追问“商业模式”,岂非本末倒置?
ChatGPT管窥(下),拟从知识的视角切入,敬请关注。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 09:00
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社