||
【编者按】通过电池老化实验与dQ:dV特征提取,利用梯度提升回归树(Gradient Boosting Regression Tree,GBRT)机器学习算法,成功预测钠离子电池剩余使用寿命(RUL),该研究对电池研究领域具有较强的参考价值。
文末彩蛋:赠送谭编dQ/dV绘图模板、谭编dQ/dV全自动计算与绘图ExcelVBA工具(试用版)。15秒从几百圈充放电数据,计算并绘制dQ/dV图。史上最快dQ/dV计算绘图神器!
引用本文: | 史永胜, 翟欣然, 胡玙珺. 基于机器学习的钠离子电池剩余使用寿命预测[J]. 华南师范大学学报(自然科学版), 2023, 55(3): 17-24. doi: 10.6054/j.jscnun.2023031 |
Citation: | SHI Yongsheng, ZHAI Xinran, HU Yujun. Machine Learning-based Prediction of the Remaining Life of Sodium-ion Batteries[J]. Journal of South China Normal University (Natural Science Edition), 2023, 55(3): 17-24. doi: 10.6054/j.jscnun.2023031 |
史永胜,翟欣然,胡玙珺
陕西科技大学电气与控制工程学院,西安 710021
摘要: 钠离子电池容量退化具有非线性和复杂性,准确预测剩余使用寿命(RUL)十分困难,因此构建SSA优化算法结合梯度提升回归树(GBRT)的RUL预测模型。对实验数据进行滤波平滑处理,绘制容量增量(IC)曲线,从IC曲线中提取与容量衰减相关性高的健康指标(HI),即IC峰值、峰值对应的电压值、峰值面积以及峰值斜率。利用PCA算法对数据进行降维处理以减少数据间的冗余性,将处理后的数据输入GBRT模型,并采用SSA算法寻找最优超参数提高预测精度。利用多组老化实验数据进行验证,RMSE、MAPE和MAE分别在15.2、7%、11.2以下,结果表明该模型有较高的预测精度及稳健性且优于其他主流算法。
关键词: 钠离子电池 / 剩余使用寿命 / 增量容量曲线 / 梯度提升回归树
锂电池因其高能量密度、高功率密度和长寿命而成为电动汽车的主流储能系统,但随着锂离子电池市场的迅速发展,锂资源短缺问题也越来越突出[1-2],同时锂离子电池的安全性以及价格飞涨问题也限制了其在储能系统上的应用[3]。与锂离子电池相比,钠离子电池因成本低、性价比高、低温性能优异等优势在中低速电动车和大规模储能等领域展现出广阔的应用前景,所以它是非常理想的锂离子电池替代品[4]。然而,钠离子电池在实际应用过程中,会产生各种副反应导致容量退化、性能降低,如果不在钠离子电池寿命终止之前及时替换会引发严重的安全事故。因此,针对钠离子电池特性,开发钠离子电池的剩余使用寿命(Remaining Useful Life,RUL)预测方法对于延长电池使用寿命、保证使用安全具有重要意义[5-7]。
现有的电池RUL预测方法主要包括基于物理学模型、基于统计学方法、基于机器学习的方法等[8], 其中基于物理学模型的方法需要对电池的物理特性进行建模和深入研究,但是建模过程复杂、计算量大,同时考虑到电池复杂的非线性行为和耦合效应,其预测精度有限[9]。基于统计学的方法主要采用统计模型来处理电池的历史数据,但是受到数据质量和采样频率的限制,预测精度受到一定程度的影响。
基于机器学习的方法则是利用机器学习技术对电池的历史数据进行学习和建模,以实现电池的RUL预测[8, 10]。该方法能适应电池复杂的非线性行为和耦合效应,并且具有较高的预测精度和实时性。常用的机器学习算法包括支持向量回归(SVR)、人工神经网络(ANN)、高斯过程回归(GPR)等。徐佳宁等[11]开发了一种结合SVR的蚁狮优化算法(IALO),它利用了间接健康因素,能够更精确地预测电池RUL。CHEHADE等[12]开发了基于GPR模型的电池容量预测方法,通过引入不确定性度量来交叉关联不同电池单元的容量趋势。然而,由于自充电和容量再生,电池衰退轨迹具有多模态特性,SVR或GPR等传统预测模型无法准确表征这种多模态。
针对以上问题提出了集成算法(EL),EL算法集成了多个单体算法,并加入了有效的策略。与单一算法相比,EL具有预测精度高、泛化能力强、不易陷入过拟合等优点,在预测方面具有无可比拟的优势[13]。EL主要包括梯度提升回归树(GBRT)和随机森林(RF)[14]。ROMAN等[15]采用了机器学习管道的方式对电池健康状态进行了评估,证明了RF在考虑不确定性评估指标时,RF很难校准,并且在预测中过于乐观。因此本文选用GBRT模型,GBRT模型能更好地处理电池衰减过程中的非线性特征,并具有适应复杂关系和多模态的能力。此外,GBRT模型具有高预测精度、鲁棒性和抗过拟合能力,通过组合多个决策树来减少过拟合风险,提高模型的泛化能力。
机器学习的方法具有很好的性能,但它需要有效的训练和大量的实验数据[16]。电池的容量衰减与端子电压的变化密切相关。增量容量分析(ICA)是一种有效的非破坏性分析方法,可以将内部电化学反应导致的电压平台转换为IC峰值[17]。
基于以上分析,本研究制造并测试了一种钠离子电池。从IC曲线提取可以表征电池衰减的健康指标(HI),通过提取的电池HI来预测电池的寿命,使用自测实验数据验证了GBRT模型的有效性。为了提升预测准确性,采用麻雀搜索算法(SSA)确定最佳的超参数,以此来提高算法的性能,并有效防止过度拟合。结果表明,SSA-GBRT模型的预测效果优于当前流行的决策树、RF、SVM、GPR等机器学习技术。平均测试MAE约为9.24,MAPE约为2.76%,RMSE约为13.5,预测误差小于50个周期的计数率可以达到99%。
麻雀搜索算法(Sparrow Search Algorithm, SSA)是于2020年提出的一种新的群体智能优化算法,其灵感来自麻雀的觅食和反捕食行为。该算法具有全局搜索能力强、稳定性好、收敛速度快的优点。
麻雀在觅食过程中的行为可以抽象为具有侦察和警告机制的生产者-觅食者模型。生产者具有较高的适应能力和较宽的搜索范围,可以引导鸟群进行搜索和觅食。为了提高身体素质,拾荒者跟随生产者觅食。与此同时,一些拾荒者监视生产者进行食物竞争或觅食,以提高自己的捕食率。当整个鸟群受到捕食者的威胁或意识到危险时,它会立即采取反捕食行动。
假设在d维搜索空间中有b只麻雀,第i只麻雀在d维查询空间中的位置为Gi=[gi1,gi2,…,gid]。位置可表示为
麻雀算法的适应能力可描述为
其中适应度函数f(x)为预测结果与实际数据之间的RMSE。
梯度提升回归树(Gradient Boosting Regression Tree,GBRT)是一种基于决策树的集成学习算法,通过构建多个决策树对样本进行分类或回归。GBRT通过结合boosting技术来增强传统的决策树方法,其核心思想是聚合一组“弱”模型,形成一个单一的“强”模型,而不是建立一个优化模型。在GBRT中,通过最小化残差生成新的决策树。这种顺序模型构建过程基本上是函数梯度下降的一种形式,即通过在每一步添加一棵新树来优化预测,以最小化损失函数。在GBRT中,平方损失函数因其简单性和一致性而被用于回归问题:
假设将构建M个决策树,GBRT框架从初始模型F0(x)开始。对于每次迭代m=(1, 2, …, M),补偿残差相当于优化展开系数ρm和αm:
得到
根据梯度下降的思想,可以使用最小二乘法求解最优αm:
其中,β是权重因子,ri是使用先前模型评估的负梯度。
为了展示本文预测模型的优越性,与其他模型进行对比实验,包括SVR、RF和GPR等预测模型。
SVR是一种基于支持向量机的回归算法,通过在输入特征空间中找到一个超平面,最小化函数间隔之和,并控制预测结果与真实值之间的误差。
RF是一种集成学习方法,通过组合多棵决策树的预测结果来进行回归。它利用随机抽样和特征选择,增加模型的多样性,并通过投票或平均的方式整合各个决策树的预测结果。
GPR是一种非参数的回归方法,利用高斯过程建模,并通过对函数进行采样和后验分布更新来预测新数据点。它能够灵活适应不同数据特征,并提供预测的不确定性估计。
通过对比实验可以评估这些模型在预测任务上的性能表现,以证明本文提出的模型在性能上的优越性。
对钠离子电池进行了长期循环实验。将组装的Na4Fe3(PO4)2P2O7电池静置10 h,促进稳定的SEI层形成。实验在30 ℃恒温环境中进行,实时监测电压、电流等参数(图 1)。活化阶段进行了0.1C倍率的充放电循环,随后分别进行了1.0C、1.5C和2.0C倍率的充放电循环。充电阶段:以0.128 mA的电池恒流充电至3.8 V,转入恒压充电直到电流降至0 mA,搁置5 min。放电阶段以0.128 mA的电流放电至1.8 V,搁置5 min,如此循环。图 2展示不同倍率下钠离子电池的容量衰减曲线,在2.0C、1.5C和1.0C倍率下分别循环1 156、1 717、1 955次。
图 1 充放电策略
Figure 1. The charging and discharging strategy
图 2 钠离子电池的容量衰减曲线
Figure 2. The capacity decay curves of sodium ion batteries
容量增量分析(Incremental Capacity Analysis,ICA)作为一种有效的非破坏性电池分析方法,已被广泛用于了解电池老化机制。ICA将电压平台转化为增量容量(IC)峰值,间接反映了内部化学反应的平衡过程。通过建立内部电化学特性和IC峰值的对应关系评估电池容量和内部相变。选择ICA方法研究钠离子电池的老化特性,通过IC曲线评估老化状态和观察活性材料的嵌入和脱嵌过程(图 3~图 5)。
Figure 3. The unfiltered IC curves
图 4 电压平台与IC曲线
Figure 4. The voltage plateau and the IC curves
图 5 放电IC曲线
Figure 5. The IC curves for discharge
对IC曲线数据进行微分计算:
钠离子电池的IC曲线基于实验测量(电压和电流)。因此,IC曲线的形状对于测量噪声非常敏感,特别是在引入导数运算符的情况。图 3为未滤波处理的IC曲线。使用文献[18]提供的方法进行平滑和滤波,即Savitzy-Golay滤波器。窗口的点数设置为10,多项式阶数设置为2,电压间隔为20 mV。图 4为滤波后2.0C倍率下钠离子电池的首次充放电曲线,IC曲线电压平台与IC峰值一一对应。
在不同充放电倍率下测试放电过程的IC曲线,实验结果如图 5所示,随着循环次数的增加,IC曲线的峰值、对应电压和峰值面积减小,而斜率增大。这表明电池逐渐老化,容量下降,内阻增加,电池的衰减速度加快。因此,IC曲线中的峰值、电压和峰值面积提供了关于电池容量和衰减速度的重要信息。
综上所述,本文选用IC峰的变化数据来预测电池RUL。
根据前文的IC曲线分析,选择放电过程中的IC峰值、峰值对应的电压值、峰值面积以及峰值斜率这4个变量作为电池的老化健康指标(Health indicators, HI),分别简化为HI1、HI2、HI3和HI4。
采用灰色关联分析来表征所提出的HI与钠离子电池RUL的相关性。
各个HI与容量衰减相关强度如表 1所示,4个老化指标HI1、HI2、HI3和HI4与RUL的ξ均超过0.7,这表明指标之间存着非常强的相关性,而且HI1、HI2、HI3的ξ均超过0.8,这证明选用HI预测钠离子电池RUL具有可行性。
表 1 HI与RUL的相关系数
Table 1. The correlation coefficient between health indicators and RUL
2.2.3 基于主成分分析的HI降维
机器学习方法容易受冗余信息的影响,可能导致过拟合。因此,在提取HI数据后,采用主成分分析(Principal Components Analysis,PCA)进行降维,以减少维度。
选择IC峰值、峰值电压、峰值面积和峰值斜率这4个变量作为电池老化的HI指标(4维数据),并进行PCA降维。每N个周期(N为1 156、1 717、1 955,分别对应2.0C、1.5C、1.0C倍率),提取HI并组成4维特征矩阵。对输入的样本变量矩阵进行归一化处理,确保数据一致性。
归一化方法公式:
协方差矩阵Σ公式:
贡献率Ci和累积贡献率C的计算公式:
本实验选择保留2个主成分,即PCA降维后,数据从原来的四维向量变成了降维后的二维向量。这意味着,选取的2个主成分包含了原始数据中大部分的信息。通过这种方式,可以减少对HI的监测量,同时仍保留了足够的信息来对电池的健康状态进行判断。
3 结果与讨论
钠离子电池RUL预测具体实现过程如图 6所示。使用SSA算法优化GBRT模型的超参数,以提高模型的预测精度。在GBRT模型中,需要优化的超参数包括决策树数量、决策树最大深度和学习率。因此,SSA算法的变量维度为3。SSA算法的参数设置见表 2。
图 6 钠离子电池RUL预测流程
Figure 6. The RUL prediction process for sodium ion batteries
表 2 SSA参数设置
Table 2. Parameter settings for SSA
由SSA优化算法的适应度曲线(图 7)可知,在第8次、第10次和第6次迭代时,适应度已经达到最小值。通过SSA算法寻优,确定了GBRT模型的最佳参数设置(表 3)。
图 7 SSA迭代曲线
Figure 7. The fitness curves
表 3 GBRT参数设置
Table 3. Parameter setting for GBDT
为了验证电池RUL预测方法的性能,使用训练好的模型对测试数据集的不同电池进行预测。将电池的SOH量化为参考第一个周期的容量衰减率
电池的放电性能随着不可逆的电化学降解而下降,接近寿命的终点。当电池实际容量下降到初始容量的80%时,通常需要更换电池[19]。
实际运行中的电池RUL公式:
其中,nEOL表示电池的充放电循环总次数,nt表示经过时间t的充电和充电循环数。
基于式(16)对钠离子电池进行RUL预测。图 8展示了3个测试电池的RUL预测结果。黑色实线表示真实的RUL值,彩色线条表示采用SSA-GBRT、SVR、RF和GPR预测模型的结果。预测结果显示良好的拟合吻合度,MAPE最低为3.9%,准确性为96.1%。直方图分析显示本文的预测误差小于50个周期的计数率高达99%。
误差计算公式:
图 9展示了不同模型下多次运行的MAE、MAPE和RMSE的箱线图,其中横线和红点表示中值误差和平均误差。SSA-GBRT方法在3个电池的预测结果中表现最低,具有较小的误差范围和异常估计值。图 10显示了所有测试单元的平均指标,SSA-GBRT方法相对于SVR、RF和GPR方法,具有更低的MAE、MAPE和RMSE,分别为9.24、2.76%和13.5,进一步验证了其稳健性和优越性。
图 9 评价指标对比
Figure 9. The comparison of evaluation indicators
图 10 评价指标平均值
Figure 10. The average of evaluation indicators
本研究制造并测试了一种钠离子电池,对其进行长期循环老化实验, 对电池老化数据经过滤波处理后使用SSA-GBRT预测模型对电池进行剩余使用寿命(RUL)预测,主要的结论如下:
(1) 对IC曲线进行平滑和滤波,选择20 mV的电压间隔,减少噪声干扰,所提取的IC曲线能够和充放电的电压平台良好对应,IC曲线峰值所包含的信息可以表征电池老化衰减。
(2) 从所获得的老化实验数据中选择了IC峰的峰值、峰值对应的电压值、峰值面积以及峰值斜率作为HI,通过灰色关联分析证明了所选取的HI与钠离子电池容量衰减有较强的相关性。
(3) 使用PCA方法可以将HI数据从高维空间降到低维空间中,减少了数据间的冗余性,提高了预测模型的精度和稳健性。
(4) 通过实验数据验证了SSA-GBRT钠离子电池RUL预测的准确性及有效性。与传统方法相比,SSA-GBRT方法在预测RUL时表现出较高的准确性,并具有良好的稳健性,RMSE、MAPE和MAE分别在15.2、7%、11.2以下。
参考文献(略)
文末彩蛋
dQ/dV模板:获得3款谭编设计的精美Origin绘图模板
模板1:dQ-2Y
模板2:dQ-2D
模板3:dQ-3D
dQ/dV Tool:获得谭编开发的Excel+VBA程序(试用版)。
使用教程:dQ/dV神器:15秒搞定200圈充放电数据的微分容量
推荐文献:嵌入式Co₃O₄负极材料的赝电容性能研究
欢迎投稿《华南师范大学学报(自然科学版)》,优秀稿源,从投稿到刊出周期<5个月。
电化学交流群:获得谭编电化学交流群的入群邀请(私信:Q3或Q6)。
获取方式
长按识别,发消息:dQ3
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 12:49
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社