|
引用本文
郑逸宁, 余镇, 李不凡, 杨捷, 殷林琪, 印张悦, 袁枫烨, 魏海洋, 陆嘉昊, 方世成, 陈爽, 邱锡鹏. 大语言模型的工具使用综述. 自动化学报, 2025, 51(11): 2371−2386 doi: 10.16383/j.aas.c240793
Zheng Yi-Ning, Yu Zhen, Li Bu-Fan, Yang Jie, Yin Lin-Qi, Yin Zhang-Yue, Yuan Feng-Ye, Wei Hai-Yang, Lu Jia-Hao, Fang Shi-Cheng, Chen Shuang, Qiu Xi-Peng. Survey of tool use in large language models. Acta Automatica Sinica, 2025, 51(11): 2371−2386 doi: 10.16383/j.aas.c240793
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c240793
关键词
大语言模型,工具使用,工具增强生成,智能体,具身智能
摘要
大语言模型因其强大的生成和理解能力受到广泛关注, 但在获取实时信息和执行复杂计算上仍存在局限性. 为使其更好地响应用户需求, 赋予大语言模型工具使用能力成为当下的研究热点. 首先, 明确大语言模型工具使用的基本概念, 并按照时间顺序梳理工具使用的发展脉络. 随后, 总结与工具使用相关的数据集和技术方法, 并分析其在智能体和具身智能等领域的应用. 最后, 梳理大语言模型工具使用领域未来的研究重点与发展方向.
文章导读
大语言模型(Large language models, LLM)凭借其卓越的语言理解与生成能力, 在众多领域中表现优异. 然而, 由于模型内在的局限性, 大语言模型在执行实时信息获取、精密计算等复杂任务时仍存在明显的不足. 通过引入搜索引擎、代码执行模块等外部工具, 大语言模型在复杂任务处理上的性能得以显著提升, 工具使用(Tool use)因此逐渐成为一个重要且专门的研究方向.
本文从工具使用的基本定义、发展路径、数据与评测、能力获取、扩展场景与发展前景六个方面对这一领域进行系统性探讨:
1)基本定义: 介绍大语言模型工具使用的基本概念, 并将其提炼为三种核心能力;
2)发展路径: 按照时间顺序梳理工具使用的起源与演进路径, 重点分析代码式工具与接口式工具两种主要范式在近年来的研究趋势与技术规律;
3)数据与评测: 系统地总结与工具使用相关的各种数据集与评测方法, 归纳不同数据集所覆盖的工具使用能力及其在任务评估中的作用;
4)能力获取: 按照大语言模型在工具使用中展现的不同能力, 逐一阐述获取这些能力的方法, 包括训练策略、技术手段与实际效果;
5)扩展场景: 探讨工具使用在工具增强生成之外的扩展应用场景, 着重讨论智能体和具身智能两个领域的实践与潜在发展方向;
6)发展前景: 结合当前研究现状, 总结大语言模型工具使用的技术发展方向及其未来应用前景, 分析这一领域未来研究面临的技术挑战与突破点.
本文就大语言模型工具使用的关键研究要素和主要技术问题进行回顾和综述, 以帮助读者深入了解这一领域的最新发展及未来展望.
图1 大语言模型工具使用的典型流程
图2 多工具调用示例
本文全面介绍大语言模型工具使用的发展. 从基本概念出发, 系统梳理其主要的研究进展, 并对与工具使用相关的数据集和评估方法进行分类与总结. 此外, 本文探讨获取工具使用能力的多种策略, 包括情境学习、监督微调、强化学习与系统框架优化等. 最后, 本文深入分析当前工具使用能力的拓展场景, 以及工具使用面临的挑战和未来的发展方向, 为相关领域研究人员提供参考.
作者简介
郑逸宁
复旦大学计算与智能创新学院博士研究生. 2019年获得复旦大学学士学位. 主要研究方向为大语言模型中的代码生成与工具使用. E-mail: ynzheng19@fudan.edu.cn
余镇
复旦大学计算与智能创新学院硕士研究生. 2022年获得江西师范大学学士学位. 主要研究方向为工具学习和个性化智能体. E-mail: yuz24@m.fudan.edu.cn
李不凡
复旦大学计算与智能创新学院硕士研究生. 2024年获得东北大学学士学位. 主要研究方向为大语言模型的后训练. E-mail: 24210240197@m.fudan.edu.cn
杨捷
复旦大学计算与智能创新学院硕士研究生. 2021年获得武汉大学学士学位. 主要研究方向为工具调用与智能体. E-mail: yangj24@m.fudan.edu.cn
殷林琪
复旦大学计算与智能创新学院博士研究生. 2025 年获得复旦大学学士学位. 主要研究方向为工具学习. E-mail: 21307140112@m.fudan.edu.cn
印张悦
复旦大学计算与智能创新学院博士研究生. 2021年获得华东师范大学学士学位. 主要研究方向为大语言模型和机器推理. E-mail: yinzy21@m.fudan.edu.cn
袁枫烨
复旦大学计算与智能创新学院硕士研究生. 2024年获得同济大学学士学位. 主要研究方向为大语言模型的工具调用与智能体. E-mail: fyyuan24@m.fudan.edu.cn
魏海洋
复旦大学计算与智能创新学院硕士研究生. 2022年获得安徽大学学士学位. 主要研究方向为工具学习和复杂意图检测. E-mail: 23210240325@m.fudan.edu.cn
陆嘉昊
复旦大学计算与智能创新学院博士研究生. 2025 年获得复旦大学学士学位. 主要研究方向为工具学习. E-mail: 21307130022@m.fudan.edu.cn
方世成
复旦大学计算与智能创新学院博士研究生. 2025 年获得复旦大学学士学位. 主要研究方向为工具学习. E-mail: 21307140067@m.fudan.edu.cn
陈爽
复旦大学计算与智能创新学院博士后. 2023年获得东北大学博士学位. 主要研究方向为自然语言处理和大语言模型中的情感计算. E-mail: chenshuang_fd@fudan.edu.cn
邱锡鹏
复旦大学计算与智能创新学院教授. 2006年获得复旦大学博士学位. 主要研究方向为自然语言处理和大语言模型. 本文通信作者. E-mail: xpqiu@fudan.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-11 04:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社