博文

Google和OpenAI开启智能Agent的新时代

已有 7662 次阅读 2024-5-18 08:01 |个人分类:人工智能|系统分类:科普集锦

Google和OpenAI开启智能Agent新时代

最近Google和OpenAI接连发布AI的最新技术发展，引人注目的是AI Agent的最新应用，如OpenAI的 GPT-4o和Google的Project Astra。

LLM-based Agent实质是在原有LLM语言大模型向多模大模型（文本、语音和图像视频等多模训练数据）的延伸与发展，并在LLM的基础上，融合与环境交互的功能模块。比如加持长期记忆模块，可以学习使用者的习惯，实现个性化助理的功能。

GPT-4o和Google的Project Astra的发布，让我们看到了未来个性化助理（比如在手机上，或者在笔记本部署个人智能电脑管家）的雏形与真正实用的希望。

当然，这些归功于数据驱动（data-driven）AI的突破，本质上又是Deep Learning（多层深度神经网络）的应用。

上述最新的发展，显然仍然是通过计算机（机器）学习到的感知智能（Perceptional Intelligence），向决策智能（Decision making intelligence）的过渡。

而未来的发展，比如继续向决策智能（或者是认知智能 Cognitive Intelligence）发展：也就是利用这些机器习得的粗糙知识和对物理世界的理解，进一步融合做的能力（doing），比如说决策（decision making）、计划（planning）、思考和反馈（thinking，reasoning and reflection）、执行（doing and executing）等。

具体形式可以包括，软硬结合的，比如自动驾驶、人形机器人、智能控制系统等。还有纯软形式的，比如自动编程、个人健康及生活助理、企业生产流程及活动优化智能软件等。

可以预见：LLM的里程碑式的DL应用的突破，正在进一步形变，而将其发展的触角进一步融入到我们的日常生活、生产、科研等实体活动中，从而发挥其更加强大的变革力量。

转载本文请联系原作者获取授权，同时请注明本文来自罗汉江科学网博客。
链接地址：https://blog.sciencenet.cn/blog-451666-1434587.html

下一篇：大模型LLM的未来发展

欢迎参加科学网十佳博文评选活动！

主办单位：