博文

油气人工智能将通向何方？精选

已有 5771 次阅读 2024-11-26 11:58 |个人分类:科学普及|系统分类:论文交流

石油工业具有重资产、高投入、高风险、靠规模效率取胜等特征，是典型的传统产业。面对数字经济时代快步到来和数字智能技术产业化的巨大冲击，必须尽快找到对接人工智能赋能的途径。然而，传统行业人工智能应用落地却非常艰难，特别是业务逻辑复杂的油气行业，当前的情况，一定程度上迷失在“高成本试错阶段”！任何一项顶层设计，都意味着巨大的投资和随之而来宏大的基础设施建设，将深刻影响全产业链的流程重构和数据体系及知识体系的重置，甚至可能决定整个行业的生存和兴衰。2024年11月初，应中国石油学会测井专业委员会邀请，我做了《人工智能发展趋势与油气领域应用实践》的分享，结合自己的长期思考和人工智能最新进展，提出“油气人工智能将通往何处”和“如何大幅度降低试错成本”等问题，部分内容发表在今天2024年11月26日的《中国石油报》第5版，感谢责任编辑马睿的精心编排。

油气人工智能将通向何方?

肖立志中国石油大学（北京）人工智能学院创院院长

2024年9至10月，人工智能（AI）迎来3个历史性时刻——9月12日，OpenAI发布新模型o1，并称“在涉及化学、物理和生物等专业的测评中，o1的表现超过了人类博士水平”；10月8日，2024年诺贝尔物理学奖揭晓，美国和加拿大科学家约翰·霍普费尔德、杰夫里·辛顿两人获奖，表彰他们基于人工神经网络实现机器学习的基础性发现和发明；10月9日，2024年诺贝尔化学奖揭晓，谷歌旗下AI公司DeepMind的2位科学家德米斯·哈萨比斯和约翰·江珀获奖，表彰他们利用人工智能在蛋白质结构预测方面的贡献。这些进展表明，基于机器学习的人工智能理论，其物理基础牢固，化学应用可靠，“超级人工智能”正在快步向我们走来。可以预见，未来若干年，优秀人才和资金将大规模涌入人工智能领域。

人工智能赛道正在迎来重大变革

人工智能（AI）听起来很神秘、很复杂，但机器学习的核心要素就是3个，即数据（包括数值数据和文本数据）、以人工神经网络为基础的算法、由芯片和电力决定的算力。模型训练过程，是使损失函数最小化或者使相似性概率最大化的迭代拟合过程。

　　相比于传统机器学习算法，深度学习算法可以处理更大量级的数据，并且在特征提取、模型训练方面更加出色。深度学习增强了机器学习算法的通用性，促进人工智能产业的快速发展。我国正在大力推动数字化转型。2020年底至2021年初，中国石油、中国石化、中国海油等能源央企纷纷表态，要把握大势、抢抓机遇，推动数字化转型和智能化发展。2022年1月12日，国务院发布《“十四五”数字经济发展规划》，加快能源领域数字化转型，提升能源体系智能化水平。国务院国资委更是连续10次发布数字化转型的方法论和体系架构相关标准T/AIITRE 10001-2020，明确数字化转型的核心要义是要把基于工业技术专业分工取得规模化效率的发展模式，逐步转变为基于信息技术、数字技术、智能技术取得多样化效率的发展模式；并指出，这是一场“系统性变革”，是价值体系的“优化、创新和重构”，其核心路径是“新型能力建设”，关键驱动要素则是“数据”。

　　 2023年3月31日，国家能源局发布《关于加快推进能源数字化智能化发展的若干意见》，涉及涵盖油气绿色低碳开发利用上、中、下游的6个重点领域，包括“推动智能测井、智能化节点地震采集系统、智能钻完井、智能注采、智能化压裂系统部署、远程控制作业”。一幅包含智能油气田、智能管网、智能炼厂等在内的智能化应用画卷正在全面铺开……

　　但是，2022年底ChatGPT横空出世，生成式人工智能异军突起，智能化发展路径出现颠覆性变革。大语言模型成为AI发展的主赛道。ChatGPT是“面向开放任务的通用助理”，能够准确理解提出的问题，并给出具体而详细的解决方案。它可以进行“创意性写作”，初步实现知识生产的第一种方式，即“类比与综合”。它还能够按人类逻辑生成控制指令，对无人机或复杂机器人进行操控。2023年12月，卡内基梅隆大学在Nature刊发的文章显示，利用ChatGPT-4协同实验自动化工具，可以在很短的时间内重现2010年诺贝尔化学奖获奖者的工作。它按照文献和数据搜索、制定研究计划、执行计划并自动编程和远程操控仪器、进行实验数据采集与处理分析、形成研究结论并自动生成研究报告，试图实现知识生成的第二种方式，即科学实验。

　　面对这些进展，学术界部分专家惊呼“超级人工智能已经在路上”。一般认为，人类智能可以分为结构化智能和非结构化智能两类。结构化智能又分为可以利用有限次二进制运算的传统计算机完成的算法智能，以及需要无限次传统运算或者量子计算机才能完成的有关“创造”“自主”和“信念”的智能。现在，采用生成式大语言模型，结构化智能均可通过传统二进制计算机（无须量子计算机）实现。至此，一个新的“智能物种”已经形成，即硅基生命的雏形，至于它是否需要具有意识科学范畴里的“私密体念”，即非结构化智能，已经无关紧要了。届时，以正在形成的硅基智能物种为基础的具身智能将应运而生，它使大语言模型实体化和个性化，成为聪明的“人造外星人”，在工业生产环境等闭合场景中生存和行动，从而使人工智能从“数字世界的一种认知方式”，转变为“物理世界的一种生产方式”。这有可能成为未来人工智能发展的重要趋势，并给生产和生活带来重大变革。

人工智能重塑全球油气行业未来

面对数字经济时代的快步到来和智能技术产业化的巨大冲击，作为传统重资产、高投入、高风险行业的油气工业，必须尽快找到数字化转型和智能化发展的途径及实施方案。

　　油气领域的人工智能应用目前处于艰难探索和高成本试错阶段。石油工业的业务链很长，涉及勘探开发、储运、炼油化工、物流和销售等上下游各环节。在从万米钻探到万里管网的各种大工程、大场景中，需要关注的是隐藏在背后的包括装备、人员、资金、油气在内的各种数据流动。而数据的流动又涉及数据的采集、传输、处理、应用、复用，以及知识的生产应用、样品的分析测试、机理模型的形成等。

　　为了让数据和知识流动起来，石油公司做了大量工作。例如，中国石油勘探开发梦想云平台，建成了涵盖勘探开发全业务链的信息化支撑体系，在量化决策、降本增效、增储上产、提高效率、转变生产组织模式等方面取得了显著成效。中国石油与华为合作开发的认知计算平台，致力于集成和适配全部机器学习算法，实现认知分析，在测井油气层识别、初至波拾取、地震层位解释、抽油机井工况诊断、单井产量递减及含水量预测等业务场景中开展应用。国际上，阿布扎比国家石油公司（ADNOC）采用全流程可视化智能调控优化系统，是油气行业现阶段数智化卓越的实践之一，并在2024年实现规模化盈利。

　　随着ChatGPT的问世，生成式人工智能为油气领域的数智化路径带来了新变革，国内外许多数字化头部企业纷纷开始进入这一赛道。2023年10月，华为发布面向油气领域的大语言模型，其基本架构为L0基础大模型、L1行业大模型和L2部署级细分场景模型。其中，L0基础大模型包含科学计算大模型（千亿级参数）、40万亿字节（TB）文本数据的计算机视觉大模型、30亿参数多模态大模型和10亿级图像预测大模型。该模型基于海量知识和模型归纳，具备自监督学习功能，可以对大模型进行预训练，并针对细分场景进行微调。L1行业大模型基于专业知识和模型泛化，可处理超过10万个油气数据，具备“边用边学”的模型优化迭代能力。L2部署级细分场景模型基于模型细分场景推理，可实现重采样、小样本类别处理的模型微调，域迁移学习和模型蒸馏，以及计算机视觉模型的工厂化生产，打通模型监控、数据回传、持续学习、自动评估、持续更新的人工智能全链路闭环。

　　2024年5月，中国石油进一步与中国移动、华为、科大讯飞签署昆仑大模型合作共建协议。这是油气行业智能化的重大事件，意味着巨大的投资和宏大的基础设施建设将提上日程。这一举措将对油气行业智能化进展产生深远影响，助推油气全产业链的流程重构以及数据体系、知识体系的重置。

　　2024年9月，斯伦贝谢（SLB）在摩纳哥发布Lumi数据和人工智能平台。该平台采用生成式大语言模型，将从根本上改变能源价值链中的数据驱动决策、操作自动化及实时优化。值得关注的是，斯伦贝谢保留了Delfi数字平台，并通过Lumi?平台的数据基础和人工智能能力，实现储层建模、地震和井筒解释、定向钻井和地质导向等工作流程的自动化和实时优化。同时，Lumi的开放架构使用了Open Group的OSDU技术标准。这在国际上引起了高度关注并逐步成为新的趋势。

我们不妨与OpenAI的o1做个对比。OpenAI声称，o1开启人工智能新范式，实现通用复杂推理。在回答问题前能够主动“思考”自动生成“思维链”，使模型能够像人类一样进行复杂推理来解答问题。由此产生的问题是，企业数据和业务决策的推理能力是否可以泛化？未来，这部分推理能力会放在应用层还是大模型中？传统行业赋能应用落地的终局，是一个强大的预训练大模型呢，还是众多垂直领域的大模型？这些选择，不仅影响 AI 产业结构和技术走向，更会决定传统行业智能化的路径和试错成本。通用基础大模型，也许只需要一个进入特定领域的学习过程，就可以适配到垂直领域。从o1，已经可以看到一条从大模型到拥有持续学习能力的“智能体”Agent的新路线。沿着这个方向，可能会大大加速生成式大模型和判别式小模型的融合落地应用。这些新趋势，又将如何影响油气行业大模型呢？由于油气行业大模型强烈依赖领导决策，目前在技术路径选择上尚很难看出端倪。

油气人工智能落地亟需厘清底层逻辑

在油气勘探领域，人工智能的应用目标主要有2个。一是对于已知机理模型的重复性工作来说，利用人工智能实现自动化，大幅提高生产效率。二是对于未知机理模型的探索性工作来说，利用人工智能扩展认知边界，从而提高符合率。

　在人工智能应用研究中，构建学术性应用场景容易，但实现工程化应用场景很难。其应用落地的复杂性难题须从多个维度解决。这包括厘清业务逻辑与发展人工智能理论，构建数据集与标签体系，使场景与算法适配，以及建设配套基础设施等。而应用落地的成熟度，很大程度上取决于数据的准备程度及治理水平。

　　人工智能作为一种“赋能工具”，具有重构各行各业的能力。展望未来，油气行业需要深入了解人工智能发展的底层逻辑，以此理论做指导才能准确把握发展方向。

　　2022年，笔者提出“四个世界模型”。第一个世界是我们所生活的物理世界，第二个世界是人类认知世界，第三个世界是机器认知世界，第四个世界是通过数字化构建的数字世界。其背后的逻辑是：人们在以数据驱动深度学习为主的人工智能技术中，通过传感器对物理世界的泛在感知，获取数据和数字孪生建模，以构建数字世界，再利用机器学习算法，通过基于明确机理的计算，使重复性工作得以自动化。也可以通过基于不明确机理的推测，来挖掘和发现数字世界的关联，使探索性工作得以突破原有的认知边界。还可以通过物理世界与数字世界的映射互动和“复合孪生体”的共享，实现物理世界局部或整体的全生命周期认知、预测、优化及闭环控制。

　　近年来的实践证明，在此基础上建构油气人工智能的理论体系，可以为油气人工智能及传统行业智能化发展提供开放、普惠、缩放兼容、可度量、可复制、可执行的理论架构。基于该架构，可以清晰理解行业人工智能应用发展的底层逻辑，并为传统行业构建人工智能应用场景提供方法论。

　　按照“四个世界模型”，在生成式大模型出现之前，AI的发展路径是通过数字化转型从物理世界步入数字世界，在数字世界利用机器学习算法，实现机器认知世界。这是一条“逆时针”的路径，与现有组织（企业）的体制机制是一种非耦合、甚至是冲突的关系。而生成式大语言模型，开辟了从物理世界到人类认知世界，通过对文本语料的学习，实现机器认知世界。这是一条“顺时针”的路径，与社会组织架构高度耦合。未来，前述两条路径将融合协同，使机器学习更强大。我们有理由相信，人工智能将在油气勘探开发等领域得到广泛应用，并基于强大的算力快速完成认知迭代，在油气全产业链各环节和多场景中形成所需的各类解决方案，提升油气行业的生产效率。与此同时，在机器认知世界里成长起来的具有空间辨识能力和行动能力的具身智能，也终将走出机器认知世界，从一种认知方式转变为生产方式，推动包括油气领域在内的各领域进入全新的发展阶段。

作者简介：中国石油大学(北京)人工智能学院创院院长(2018-2022)、地球物理与信息工程学院院长(2010-2016)；现任数据科学研究所所长，教育部非常规油气国际合作联合实验室主任。主要研究领域：油气人工智能，磁共振与应用物理，岩石物理与岩石力学，地球探测与信息技术。在Nature Physics, Nature Computational Science, Physical Review Letters等国内外学术期刊发表论文约200篇，授权国内外发明专利近100件，由英国皇家化学会出版《Practical NMR for Oil and Gas Exploration》(2023)、科学出版社出版《井下极端环境核磁共振科学仪器》(2016)等专著。