|
引用本文
陈致蓬, 韩杰, 阳春华, 桂卫华. 工业垂域具身智控大模型构建新范式探索. 自动化学报, 2025, 51(11): 2454−2472 doi: 10.16383/j.aas.c250247
Chen Zhi-Peng, Han Jie, Yang Chun-Hua, Gui Wei-Hua. An exploration of a new paradigm for constructing industrial domain-specific embodied intelligent control large models. Acta Automatica Sinica, 2025, 51(11): 2454−2472 doi: 10.16383/j.aas.c250247
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c250247
关键词
工业大模型,强化学习,有色冶金,具身反馈
摘要
大模型工业垂域化是通用智能迈向专业化应用的必然趋势, 更是驱动工业智能化转型的核心引擎. 然而, 大模型在工业领域应用中, 面临难以洞察工业时序数据内涵、难以嵌入工业物理化学规律、难以确保模型输出可信度以及难以解决复杂工业问题等挑战. 针对上述瓶颈, 提出工业垂域具身智控大模型构建范式: 创新性引入时序数据元模型化方法, 将工业时序数据转换为代码语义, 提升大模型对时序数据的理解与推理能力; 借助元模型构建工业规律知识图谱, 并将其嵌入大模型生成过程, 以确定性科学原理抑制生成随机性; 构建数字孪生与实物伴生的双轨验证平台, 通过虚实具身反馈机制、实时强化学习, 优化模型输出的可信度; 设计融合知识图谱规则评分与虚实验证专家评分的混合奖励函数, 结合自适应学习与长度正则化策略, 克服大模型解决复杂工业问题时“趋易畏难”倾向. 最终形成一个集垂域适配、具身控制、可信验证和具身反馈于一体的四层闭环架构. 应用于有色冶金领域, 构建首个有色冶金具身智控大模型, 实验验证了该范式的有效性, 为大模型从实验室走向工业现场, 架起从技术到落地的桥梁.
文章导读
大模型依托海量数据基础、高效模型架构和系统训练体系, 在多个专业领域展现出强大的适配能力与广泛的应用前景, 已成为推动人工智能发展的核心动力[1]. 随着模型规模的不断扩展和计算能力的提升, 大模型正在向更加高效化、智能化的方向发展[2−3]. 2020年, 预训练大模型GPT-3的出现标志着大模型进入迅猛发展期; 2025年, DeepSeek低成本、强推理的后训练范式将大模型发展推向新的高度[4−5].
目前, 大模型技术正在从服务业逐步迈向工业领域, 大模型技术与工业生产的深度融合标志着工业发展模式的重要跃迁: 从经验驱动转向知识驱动、从局部优化升级为全局智能, 大模型正成为新型工业化进程中不可或缺的战略性技术基座.
大模型技术在工业应用上具有三项明显优势:
1)高效语义解析能力. 大模型能够快速解析工业设备日志、工艺规程和操作手册, 精准提取关键信息并生成结构化报告和描述[6], 为自动生成分析报表等日常归纳性劳动提供广阔应用场景.
2)广域知识整合与泛化能力. 大模型通过整合多领域工业工艺知识和设备运行数据, 挖掘跨领域关联信息, 生成全局优化方案[7], 可为企业跨部门协同决策、跨工序协同调控等提供前瞻性、全局性指导.
3)动态任务适配能力. 大模型能够根据实时的工业需求与生产条件变化, 迅速生成适配解决方案, 为企业实时制定个性化的生产线调度策略, 以快速响应客户定制化需求; 利用丰富的知识储备和严密的推理能力在高度不确定的运营决策与生产管控中提供创新性解决方案[8].
然而, 大模型向工业垂直领域的深化应用, 对模型的专业适配性、结果确定性、输出可靠性及跨场景泛化能力提出更高要求. 为此, 国内外开展了大量研究.
在工业数据适配方面: 1)针对数据稀缺, Microsoft Research的生成式表数据学习(Generative tabular learning, GTL)框架通过自回归生成建模适配大语言模型(Large language model, LLM)于表格数据, 基于384个去重数据集训练的LLaMA 13B模型在少样本场景下超越GPT-4[9]. 工程领域通过领域任务自适应预训练及微调BERT、T5, 增强对小型数据集的适应性[10]. 2)为降低标注成本, 半监督与自监督学习利用未标注数据提升模型表示能力, 减少对大规模标注数据的依赖[11]. 3)针对多模态数据对齐难题, 引入对比学习和元学习, 通过学习鲁棒嵌入特征缓解数据分布差异, 提升跨领域泛化能力[12]. 上述方法在数据稀缺、标注成本高及跨领域泛化方面取得进展, 但对时间序列、图像、语音等多模态数据支持不足, 且通用性受领域数据集限制.
在工业知识嵌入大模型方面, 研究者主要通过以下方式实现: 1)预训练微调. Wu等[13]采用适配器和低秩自适应(Low-rank adaptation, LoRA)等参数高效微调技术, 仅更新2%参数, 在17个医学图像分割任务中取得显著性能提升. 2)提示词工程. Diao等[14]采用主动提示, 通过衡量不确定性, 选择最不确定问题进行注释, 在text-davinci-002和code-davinci-002的八个复杂推理任务中均优于一致性方法, 精度提升7.0%和1.8%. 3)知识图谱嵌入. Zhang等[15]设计文本知识双编码器架构: T编码器编码输入句子; K编码器处理知识图谱, 并与文本表示融合. He等[16]在双编码器架构的大语言模型预训练期间, 在知识编码器中引入知识图谱相邻实体信息. 4)混合嵌入策略. 结合符号推理和神经网络优势, 融合规则逻辑与LLM语义理解能力, 提升逻辑推理任务效率和准确性[17]. DeepMind通过图像理解、规则系统与LLM结合, 实现机器人系统高鲁棒性控制[18]. 这些方法在医疗、制造、自动驾驶和运动控制等领域效果显著.
在大模型输出可信度方面, 针对大模型幻觉和偏见问题, 研究者提出多种缓解方法: 1)检索增强生成(Retrieval-augmented generation, RAG). Lewis等[19]采用RAG、多样化束搜索和置信解码等方法, 结合外部知识库显著降低模型生成不准确内容的风险[20−21], 在编程任务中错误率降低约15%. 2)对抗训练和数据增强. Guo等[22]通过在训练中引入对抗样本和多样化数据分布, 提升生成内容可靠性, 在工业故障诊断中改善模型对噪声数据的适应性[23]. 3)思维链(Chain of thought, COT)推理技术. 引导模型逐步推理, 增强复杂任务可解释性, 在需求分析任务中显著提升语义相似性检测准确性[24]. 上述通用技术主要聚焦于降低输出幻觉, 缺乏客观验证机制和评估手段, 难以确保大模型输出方案在工业应用中的可靠性和安全性.
在大模型复杂问题探索能力方面, 研究者引入多种前沿技术: 1)多模态模型. Moor等[25]提出Med-Flamingo, 利用视觉−语言多模态大模型增强医学场景少样本生成能力, 显著提升生成式医学视觉问答(Visual guestion answering, VQA)任务表现. Wang等[26]构建智能工业视觉监控(Industrial visual monitoring, IVM)与维护框架, 通过大型图像−文本IVM数据集训练多模态大模型, 实现工业图像理解、缺陷识别、维护建议及智能交互的全流程智能化. 2)多智能体系统. Yang等[27]设计AutoHMA-LLM框架, 结合大型语言模型与经典控制算法, 通过多层架构实现任务协调调度, 增强动态场景下多智能体协作效率. Hong等[28]提出CogAgent, 通过大模型结合高低分辨率图像编码器实现图形用户界面(Graphical user interface, GUI)理解与导航, 显著提升导航VQA任务自动化水平. 3)强化学习优化. Chen等[29]构建RLingua框架, 利用大型语言模型生成机器人控制器并结合强化学习优化, 显著降低机器人操作任务样本复杂度. 这些技术在供应链优化、故障诊断等复杂任务中展现出潜力. 然而, 现有方法多聚焦于模型性能和数据多样性, 普遍忽视工业真实需求与动态场景, 缺乏可验证、实时闭环的训练框架, 从而限制大模型处理动态复杂工业问题的能力.
综上, 针对大模型工业垂域化面临的迫切需求, 本文深度挖掘大模型工业应用的四大挑战, 提出工业垂域具身智控大模型构建新范式的体系架构, 应用于有色冶金领域, 构建有色冶金具身智控大模型, 系统化验证所提范式在工业垂域中的可行性, 并展望该构建范式的应用前景与未来价值.
图1 大模型学习自然语言与时序数据对比
图2 大模型随机性与物理化学规律确定性冲突
图3 大模型低置信度分析与现有解决方案
随着工业智能化进程的加速, 工业垂域具身智控大模型逐步成为推动工业转型升级的关键工具. 通过结合深度学习、数据融合与多模态知识整合, 工业垂域具身智控大模型为工业高端化、智能化、绿色化发展提供创新解决方案.
作者简介
陈致蓬
中南大学自动化学院副教授. 主要研究方向为工业大模型, 工业仿真与数字孪生和新型工业互联网. E-mail: zp.chen@csu.edu.cn
韩杰
中南大学自动化学院硕士研究生. 主要研究方向为大模型技术和计算机图像识别. E-mail: hjiecsu@csu.edu.cn
阳春华
中南大学自动化学院教授. 主要研究方向为过程建模与优化控制, 流程工业智能优化制造. 本文通信作者. E-mail: ychh@csu.edu.cn
桂卫华
中南大学自动化学院教授. 主要研究方向为复杂工业过程建模和故障诊断与分布式鲁棒控制. E-mail: gwh@csu.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-19 18:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社