||
Google和OpenAI开启智能Agent新时代
最近Google和OpenAI接连发布AI的最新技术发展,引人注目的是AI Agent的最新应用,如OpenAI的 GPT-4o和Google的Project Astra。
LLM-based Agent实质是在原有LLM语言大模型向多模大模型(文本、语音和图像视频等多模训练数据)的延伸与发展,并在LLM的基础上,融合与环境交互的功能模块。比如加持长期记忆模块,可以学习使用者的习惯,实现个性化助理的功能。
GPT-4o和Google的Project Astra的发布,让我们看到了未来个性化助理(比如在手机上,或者在笔记本部署个人智能电脑管家)的雏形与真正实用的希望。
当然,这些归功于数据驱动(data-driven)AI的突破,本质上又是Deep Learning(多层深度神经网络)的应用。
上述最新的发展,显然仍然是通过计算机(机器)学习到的感知智能(Perceptional Intelligence),向决策智能(Decision making intelligence)的过渡。
而未来的发展,比如继续向决策智能(或者是认知智能 Cognitive Intelligence)发展:也就是利用这些机器习得的粗糙知识和对物理世界的理解,进一步融合做的能力(doing),比如说决策(decision making)、计划(planning)、思考和反馈(thinking,reasoning and reflection)、执行(doing and executing)等。
具体形式可以包括,软硬结合的,比如自动驾驶、人形机器人、智能控制系统等。还有纯软形式的,比如自动编程、个人健康及生活助理、企业生产流程及活动优化智能软件等。
可以预见:LLM的里程碑式的DL应用的突破,正在进一步形变,而将其发展的触角进一步融入到我们的日常生活、生产、科研等实体活动中,从而发挥其更加强大的变革力量。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 12:04
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社