||
作者:君安储能创始人 赵丹博士
(本文仅代表个人学术观察与观点,不代表所在机构及任何第三方立场)
摘要
2025年全国统一电力市场体系初步建成、现货市场实现全覆盖后,独立储能、虚拟电厂(VPP)、分布式新能源等新型主体批量入市,电力市场从传统寡头博弈转向万级主体参与的多主体动态博弈,传统基于完全理性假设、边际成本定价的竞价模型已无法适配新型主体跨时段套利、多价值叠加的特性。本文系统综述了博弈论与深度学习融合的AI竞价策略全球研究进展,梳理国际学界在马尔可夫博弈、多智能体强化学习领域的理论突破,以及欧洲GridBeyond、美国特斯拉Autobidder等产业的商业化实践;同时总结国内学界针对本土市场规则的算法适配成果,与兆瓦云、疆能智维等产业主体的落地探索。研究表明,AI+博弈论的融合重构了“自适应博弈论”新范式,可突破传统模型的信息假设限制,实现多市场协同、动态场景适配的收益最大化,但仍面临环境非平稳性、真实市场试错风险、监管合规缺失、本土化规则适配四大核心挑战。未来需依托“仿真-现实”平行系统、监管沙盒、可解释AI技术,推动AI竞价从仿真验证走向规模化商用,为新型主体参与电力市场提供核心工具支撑。
关键词:电力现货市场;多主体竞价;博弈论;深度强化学习;市场监管;储能参与
1 引言自2015年新一轮电力体制改革启动以来,我国电力市场化进程持续加速。据《2025电力市场化改革与电价体系洞察》数据,2024年全国电力市场化交易电量占全社会用电量比重已达62%,2025年现货市场实现省级全覆盖,独立储能、虚拟电厂、5MW以下分布式新能源等新型主体正式获得合格市场主体地位,参与日前、实时、辅助服务等多类型市场交易。这一变革使得电力市场的博弈结构发生根本性变化:市场主体数量从传统发电侧的几十家扩展到涵盖源网荷储的全链条上万家主体,交易频次从月度、日前提升至15分钟级的实时交易,价格波动幅度从传统标杆电价的±20%扩大到现货市场允许的±50%甚至更高。
传统竞价策略依赖“完全理性人”假设,即默认所有主体掌握全部市场信息、知晓对手完整策略空间,基于边际成本制定报价方案。但这一模型对新型主体适配性极差:以储能为例,其收益来自“低充高放”的跨时段能量套利、调频/备用等辅助服务收益、容量市场补偿三大类,传统静态报价模型无法捕捉跨时段、跨市场的耦合关系;虚拟电厂聚合的海量异构资源,其调节能力随用户行为、天气动态变化,预设规则式报价难以响应实时市场波动。博弈论与深度学习(尤其是强化学习)的融合,为破解上述难题提供了全新路径——AI智能体无需预设对手模型,可通过与市场环境的持续交互自主学习最优报价策略,适配有限理性主体的决策特性,成为当前电力市场领域的研究热点。
2 国内外研究综述2.1 国际学界与产业研究进展国际学界对AI+博弈论的电力竞价研究起步于2010年前后,核心聚焦理论框架突破与算法创新。斯坦福大学能源与气候实验室团队2023年在《Nature Energy》发表研究成果,首次将马尔可夫博弈模型与多智能体深度强化学习(MADDPG)结合,构建包含日前、实时、辅助服务市场的序列决策环境,仿真显示相比传统古诺博弈模型,发电商与储能主体的综合收益提升18%,且可自适应不同比例的新能源接入场景。麻省理工学院电力工程团队2024年进一步将电网安全约束、市场出清机制完整嵌入强化学习环境,训练储能主体的竞价智能体,在加州ISO(独立系统运营商)市场的回溯测试中,储能项目IRR较传统策略提升6.2个百分点,该成果已被纳入加州储能参与市场的官方技术指南。加州大学伯克利分校团队2025年针对市场环境的非平稳性问题,提出“博弈-学习”双循环框架:外层模拟对手策略的演化规律,内层优化自身报价动作,解决了多主体策略动态变化导致的智能体性能衰减问题,相关算法已在PJM市场的仿真环境中验证有效性。
产业实践层面,欧美已形成成熟的AI竞价商业化生态。欧洲GridBeyond公司的AI竞价平台整合演化博弈论与LSTM价格预测模型,为1.2GW储能、VPP资产提供多市场协同报价服务,2024年客户平均收益率较基准策略高22%,其自研的“对手策略画像”模块可实时学习市场主体的报价规律,动态调整竞价策略。美国Flower公司利用深度确定性策略梯度(DDPG)算法训练竞价智能体,参与PJM、ERCOT等6大ISO市场交易,2024年代理交易规模达3.2GW,收益同比增长115%,其算法可同时处理12种辅助服务品种的报价优化。特斯拉Autobidder系统嵌入博弈论优化的深度强化学习模型,为全球超过4GW的储能资产提供自动竞价服务,在澳洲国家电力市场(NEM)的实践中,用户侧储能收益较人工报价提升30%以上,该系统已实现“感知-决策-执行”的全闭环运行,无需人工干预。根据《2025年中国电池储能盈利模式探索:加州经验的启示》,加州储能主体通过AI优化多市场竞价策略,综合收益较单一能量市场参与提升5—8个百分点,验证了技术路线的商业价值。
2.2 国内学界与产业研究进展国内学界研究紧跟国际前沿,核心聚焦本土市场规则的算法适配。华北电力大学电力市场研究所团队2024年针对山东电力现货市场“价格上下限±50%、新能源优先消纳、储能需配建10%调节能力”等特有规则,设计改进型MADDPG竞价算法,将规则约束嵌入智能体的奖励函数与动作空间,仿真显示独立储能的竞价收益较传统规则式策略高27%,中标率提升15%。浙江大学电气工程学院团队2025年提出融合博弈论与Transformer的竞价模型,利用Transformer的时序注意力机制捕捉市场价格的长期依赖关系与多主体博弈的隐含逻辑,在山西现货市场回溯测试中,VPP的报价中标率提升19%,价格预测误差较传统LSTM模型降低8%。清华大学能源互联网研究院团队2026年针对省间壁垒、省内现货与省间交易实时耦合的特性,提出多区域协同竞价AI框架,可自动优化省间套利与省内交易的报价策略,降低省间交易损耗15%,相关成果已应用于长三角电力市场仿真平台。
产业落地层面,国内AI竞价仍处于“辅助决策+小范围试点”阶段。VPP运营商兆瓦云推出的AI竞价系统,基于多智能体强化学习算法优化用户侧储能、柔性负荷的报价策略,在山西VPP示范项目中,2024年结算收益超2.1亿元,较人工报价提升21%,系统可同时处理日前市场“报量报价”与实时市场的偏差考核优化。疆能智维的储能AI交易平台整合现货、辅助服务市场规则,为工商业储能提供自动竞价服务,用户平均收益提升25%,已接入山东、甘肃等6省的交易系统。国网、南网的电力交易平台已上线AI辅助报价功能,为发电企业提供价格预测、报价建议,但仅停留在“人工决策+AI建议”的辅助阶段,尚未实现全自动闭环交易。据《2025电力市场化改革与电价体系洞察》,当前国内80%以上的AI竞价研究停留在仿真验证阶段,真实场景落地案例不足20%,核心瓶颈是真实市场的试错成本过高与监管规则不明确。
3 核心观点:AI+博弈论重构电力竞价范式AI技术与博弈论的融合,并非简单的算法叠加,而是从底层逻辑重构了电力市场的竞价范式,核心体现在三个维度:
3.1 从完全理性博弈到有限理性自适应博弈传统博弈论(古诺、伯川德、斯塔克尔伯格)的核心假设是所有主体完全理性,掌握全部市场信息、知晓对手完整策略空间,这一假设在新型主体批量入市的场景下完全失效:工商业用户、分布式光伏业主等中小主体信息获取能力有限、算力不足,属于典型的有限理性主体;甚至大型发电集团也难以实时掌握数万家分布式资源的调节能力与报价策略。AI驱动的竞价策略无需预设对手模型,通过与环境(市场)的持续交互,自主学习近似最优反应,天然适配有限理性主体的决策特性。例如,针对现货市场中部分中小主体“报量不报价”的跟随行为,AI智能体可通过历史数据学习其报价规律,动态调整自身策略,避免陷入“囚徒困境”式的低收益均衡。国网能源研究院的测试显示,AI智能体在有限理性主体的博弈环境中,收益较传统博弈论模型高12%—15%。
3.2 多市场协同的价值最大化策略新型主体(储能、VPP、分布式新能源)的核心优势是参与多类型市场实现价值叠加:储能可同时参与能量市场的峰谷套利、辅助服务市场的调频/备用、容量市场的备用补偿;VPP可聚合负荷参与需求响应、提供虚拟惯量服务。传统竞价策略往往分市场独立优化,忽略市场间的耦合关系——例如为了参与调频辅助服务,储能可能减少能量市场的套利空间,静态优化无法实现全局收益最大。AI算法可将多市场的规则、价格信号、资源约束整合为统一优化目标,构建“收益-风险”双目标函数,实现跨市场协同竞价。根据《2025年中国电池储能盈利模式探索:加州经验的启示》,加州储能主体通过AI优化“能量市场峰谷套利+辅助服务调频+容量市场备用”的协同策略,综合收益较单一能量市场参与提升5—8个百分点;国内山东现货市场的实践也显示,协同报价的储能项目IRR较单一市场参与高3—5个百分点。
3.3 动态场景的自适应调整能力电力现货市场价格受新能源出力、负荷波动、电网阻塞、天气变化等多重因素影响,15分钟级的价格波动幅度可达2-3倍,极端天气下甚至可能出现价格触顶(如2024年浙江夏季高温天气,现货价格一度达到1.5元/千瓦时,是标杆电价的3倍)。传统规则式竞价策略依赖预设的价格阈值调整报价,难以适配动态变化的场景。AI智能体可实时接入气象预报、新能源出力预测、电网阻塞预警、市场交易等多源数据,通过时序预测模型预判未来时段的价格走势,动态调整分时段报价策略:例如,在新能源大发、现货价格触底时,AI可自动提高储能充电报价的中标率;在负荷高峰、价格飙升时,提高放电报价,同时参与备用辅助服务获取额外收益。广东电力市场的测试显示,AI智能体的动态报价策略较静态规则策略,收益提升28%,价格预测误差低于5%。
4 核心挑战与瓶颈尽管AI+博弈论的竞价策略前景广阔,但当前仍面临四大核心挑战,制约其规模化落地:
4.1 环境非平稳性与策略失效风险电力现货市场属于典型的非平稳环境:市场主体数量、策略偏好持续变化,交易规则定期调整,外部环境(如新能源装机、负荷水平)逐年演化,导致训练好的AI智能体面对新的市场状态时,性能可能大幅下降。例如,山东现货市场在2024年引入VPP参与报价后,原有基于2023年数据训练的竞价智能体收益下降32%,需要重新采集半年的新数据才能恢复原有性能。国网信通的研究显示,市场规则调整、新增10%以上的同类主体,都会导致AI智能体的收益衰减15%以上,需要持续迭代训练,增加了落地成本。
4.2 真实市场的探索风险与成本强化学习的核心机制是“试错学习”,但电力现货市场的试错成本极高:错误报价可能导致无法中标、低价亏本中标,甚至违反市场规则被处以数倍于收益的罚款。例如,2024年山西某储能主体测试AI竞价策略时,因智能体错误报高价,单日亏损超120万元,迫使企业暂停测试3个月。如何平衡“探索新策略”与“控制试错成本”,是当前产业落地的核心难题。当前主流解决方案是“仿真预训练+小流量测试”,即先在数字孪生市场中完成90%以上的训练,再拿出5%的资源参与真实市场测试,但数字孪生市场的保真度不足,仍可能导致真实场景的适配偏差。
4.3 合规性与监管审计难题AI协同报价可能触及市场监管红线:若多个主体使用同款AI算法,可能导致报价趋同,被认定为“协同操纵市场”;AI的“黑箱”决策逻辑难以向监管机构解释,出现收益异常、市场波动时,无法界定责任——是算法漏洞、主体故意操纵还是市场正常波动?当前国内《电力市场运营基本规则》尚未针对AI竞价制定监管细则,欧盟虽然已启动AI金融交易监管立法,但电力市场的公共服务属性、实时性要求尚未被覆盖。2024年欧盟某VPP运营商因AI算法导致区域报价趋同,被监管机构罚款200万欧元,凸显了合规风险的严峻性。
4.4 本土化规则的适配难题国内电力现货市场具有“省间壁垒、新能源优先消纳、价格管制、政府授权合约”等特有规则,通用AI竞价算法无法直接适配。例如,部分省份要求新能源报价不得高于燃煤基准价,储能需与新能源绑定参与市场,现货市场价格下限设置为0甚至负值(新能源消纳压力大的时段),这些约束需要嵌入AI模型的奖励函数与动作空间,增加了算法设计的复杂度。国内某创业公司直接套用美国PJM市场的AI竞价算法,在山东市场测试时,因未适配“新能源优先消纳”规则,导致报价全部被出清系统驳回,单月测试成本超50万元。
5 结论与展望AI与博弈论的融合,为电力现货市场多主体竞价提供了“自适应博弈论”的全新范式,突破了传统模型的完全理性假设限制,可最大化新型主体的市场收益,是新型电力系统下电力市场建设的核心技术支撑。未来研究与实践需聚焦三大方向:第一,构建“仿真-现实”平行系统。利用高保真数字孪生市场(整合真实历史数据、规则、主体行为、电网约束)进行高强度训练,缩小仿真与现实的鸿沟,降低真实场景的适配成本。当前国网、南网已启动数字孪生电力市场建设,预计2027年可实现主流场景的覆盖率90%以上。第二,建立AI竞价监管沙盒。允许符合安全要求的算法在小范围市场(如单一省份的储能主体)测试,逐步完善监管规则,明确AI竞价的责任界定、审计要求、合规边界,在创新与风险之间取得平衡。第三,发展可解释AI(XAI)技术。将博弈论逻辑嵌入AI决策过程,使报价策略的生成逻辑可被监管方、市场主体理解与审计,破解“黑箱”难题,提升市场信任度。
国内学界与产业界需结合本土市场规则,加快核心技术攻关,推动AI竞价从仿真走向真实场景落地,为新型主体参与电力市场提供核心工具,助力全国统一电力市场体系建设,支撑“双碳”目标的实现。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-30 22:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社