博文

21级硕士生赵志强在IEEE Trans on Smart Grid发表两篇论文

已有 7715 次阅读 2024-2-19 16:16 |系统分类:科研笔记

2021级硕士生赵志强同学在IEEE Transactions on Smart Grid发表两篇论文，均聚集于具有隐私保护性的窃电检测方案设计。

数据作为生产要素越来越受到社会的重视，数据的共享流通将成为数字经济的基石。数据作为生产要素，释放数据的价值是首要任务。那么如何真正的释放数据的价值，发挥数据的作用呢？这就需要将数据进行开放、共享和交易，以从数据中分析出有价值的信息。但是，数据蕴含着隐私敏感信息，例如，医疗数据含有患者的患病信息，患者可能不希望除医生之外的其他人知晓其病情。因此，除了机密数据外，数据应该在完成相应的脱敏后，成为公共资源供数据消费者进行分析利用。

同时，借鉴《三体》中的黑暗森林法则：在宇宙的尺度上，当一个文明得知另一个文明可能存在后，由于猜疑链的存在，他无法确认对方文明是否“善意”，又因为存在技术爆炸的可能性，所以无法确定对方文明是否会突然发展到足以威胁到自己的程度。所以对于新发现的这个文明，唯一的处理方式就是在第一时间对其进行打击使得它不再适合生存。类比到数据拥有者和数据消费者上，由于猜疑链的存在，数据拥有者无法确认数据消费者是否是“善意的”，同时因为数据推理攻击技术不断的发展，数据拥有者唯一的处理方法就是采用隐私计算方法去实现“数据的可用而不可见”，在数据进行开放、共享或者交易前进行合理保护处理，避免在后续分析过程中泄露敏感信息。但是，严格的隐私保护程度将会使得数据消费者难以得到满意的结果，也将会阻碍数据交易市场的形成。我们以电力数据为研究对象，以窃电检测为数据分析的实例，把数据分析与数据隐私结合起来，并尝试为以数据消费者为中心的数据隐私化研究提供示范。

2021年11月，合肥供电公司从橡树湾小区一块小小的电表“起源”，与合肥警方“顺藤摸瓜”，联合发现一起涉及面达10省市、108户的大型窃电案件。据统计，合肥供电公司2021年累计查处窃电及违法用电1282户，追捕电量824.1万千瓦时，共为国家挽回经济损失2507.5万元。通过加强对窃电行为的监管和打击，能够有效地保护电力资源，维护正常的供电秩序，促进社会经济的健康发展。

传统的窃电检测方式是通过人工检查，耗时耗力且效率低下。智能电网的出现提供了一种新的方法。智能电网可以收集用户的实时细粒度用电数据，何为细粒度用电数据？就是进行更加详细的记录，采用更频繁的数据采集间隔以收集更具体的用电信息。电力公司通过用户细粒度数据来分析用户的用电方式和习惯。绝大多数正常用户在用电模式上呈现一定的周期性，而窃电用户在用电模式上是周期性较差或者是非周期性的。现有的分析方法中，深度学习模型可以通过神经网络有效提取用电数据更深层特征，通过训练深度学习模型可以有效检测窃电行为。然而，现有的窃电检测方法通常假设电力公司能够掌握用户的全部数据，这与数据隐私相悖，另外，也不符合数据交易、数据共享的现实。为此，可以进行隐私化处理后进行窃电检测，以此来保护用户隐私的同时有效地打击窃电行为。通过采用隐私保护技术，能够在不牺牲数据安全与隐私的情况下取得窃电检测方面的新突破，为该领域带来更多发展机会。

在进行窃电检测时，基于深度学习的检测模型的第一层全连接层神经网络进行用电数据与权重参数在向量形式下的乘法运算，即内积运算，然后将内积结果输入至下一层网络中，经过一层一层的神经网络的运算得到检测结果。因此，一种隐私化处理方法是在用电数据的密文状态下进行内积运算，且不改变运算结果。另外，通过一种隐私化处理便可以实现多种任务的运算是最理想的。

功能加密恰好可以满足以上要求。功能加密方案允许加密者仅对数据进行一次加密，使解密者在数据的密文上通过解密密钥进行多种特定任务的运算。但是，解密密钥是使用加密密钥来生成的，因此，加密密钥和解密密钥需要可信的密钥生成中心来生成，从而分发给加密者和解密者来分别执行加密和解密操作。在智能电网中，可以使用功能加密方案来在用电数据的密文状态下进行窃电检测和区域用电量总和的运算。通过对区域用电量总和的计算，电力公司可以进行合理的电力调度，保障电力供应。

但是，当数据脱离自身的控制后，其他机构中心的任何行为都是无法所预知以及控制的，因此在实际应用中，将机构视为完全可信是不符合实际的。一旦其他机构中心存在恶意行为或被恶意攻击，用户的隐私依然会被泄露。另外,现有的方案存在一些安全问题，例如，用户之间串通或者控制中心和第三方机构中心串通以发起合谋攻击（Collusion Attack）来非法获取其他用户的用电数据，控制中心被恶意攻击导致的数据篡改等问题。

图1 系统模型图

因此，文献[1]提出了一种改进的功能加密（Functional Encryption）方案，消除了可信第三方机构中心的参与，保护用户隐私并进行区域用电量聚合和窃电检测任务。区域用电量聚合就是统计某一时刻当前区域内所有用户的用电量总和。如何使方案不需要可信的密钥分发中心来参与呢？通过分析发现，用于区域用电量聚合的解密密钥可以拆分，通过聚合的操作来生成。因此本文中，所有智能电表随机生成各自的私钥，采用安全聚合算法来生成解密密钥。举个简单的例子，智能电表A和智能电表B来共同计算解密密钥，它们之间协商一个随机数x,对于协商的随机数，一方执行加法，另外一方就执行减法。例如，A将私有数据加x得到结果M，那么B就将私有数据减去x得到N,之后将A和B分别将结果发送到检测中心，检测中心执行M+N，这样在相加后就可以完全消除掉随机数，从而在不揭示各自的私有数据下共同计算出总和，需要注意的是，当智能电表的数量增加时，协商的随机数越多，攻击者就越难推理出私有数据。因此，用于计算区域用电量总和的解密密钥就可以共同计算出，这样就可以在不需要可信第三方的情况下进行区域用电量总和的计算。

另外，本文设计了基于区块链的系统模型来为智能电网提供安全保证。具体来讲，区域内的所有智能电表选举出一个智能电表作为挖掘节点（Mining Node，MN）来进行区域用电量聚合任务，同时将密文和用于窃电检测任务的解密密钥存储在区块链中，控制中心比较区域供电量与区域用电量总和来判断当前区域是否存在窃电行为。若存在，控制中心读取密文和解密密钥进行解密操作得到用电数据与模型参数的运算结果，之后将运算结果输入到检测模型中推理出用户是否存在窃电行为。通过实验评估和安全性分析，本方案可以保证智能电网的安全并且保护用户隐私，同样满足了智能电网的基本任务需求。

在智能电网实际运行中，电网规模庞大，智能电表数量众多、采用加密的方法在数据传输过程中将会带来巨大的通信开销。现有方案没有考虑检测周期的影响和合理性，这些方案在一个不切实际的检测周期（1035 天）的数据集上进行训练和测试。另外，一些方案无法同时完成动态计费和区域用电量聚合任务，需要为一项基本任务付出昂贵的成本。

因此，文献[2]提出了一种实用的隐私保护窃电检测方案,隐私保护实施流程如图2所示。具体来讲，本文基于内积加密的思想实现了加噪后的用电数据与模型参数的运算，噪声会在运算中完全消除，只能得到原始用电数据和模型参数的内积结果，攻击者无法从内积结果中反解出原始数据。之后控制中心将内积结果加入偏置输入到之后的网络进行运算，得到检测结果。内积加密可以实现两个向量在密文状态下通过解密得到二者的内积结果。本文重要的是，用电数据经过加入伽马噪声后，在进行区域用电量聚合时，伽马噪声的总和是拉普拉斯噪声。差分隐私中的拉普拉斯机制就是在查询结果上插入拉普拉斯噪声。因此，此时就同时实现了聚合上的差分隐私，也就是实现区域用电量聚合的差分隐私保护。另外，对于动态计费，只需要重新插入伽马噪声，执行相同的运算就可以得到用户用电数据与动态的定价费率的内积结果，也就是电费总和。

图2 隐私保护实施流程

此外，文献[2]提出了一种新的检测模型结构，并探讨了检测周期的影响。该模型通过提取用电数据的局部和全局特征以实现更高的检测性能。最后，通过实际功耗数据和实际设备进行了大量仿真实验，如图3和图4所示，实验结果也证明了该方案能够在资源受限的设备上运行，具有更低的通信开销和更好的模型检测性能。

图3 随时间增加的通信开销

图 4 随智能电表数量增加的通信开销

相关论文已在IEEE Transactions on Smart Grid发表：

[1] Z. Zhao, Y. Liu, Z. Zeng, Z. Chen and H. Zhou, "Privacy-Preserving Electricity Theft Detection Based on Blockchain," in IEEE Transactions on Smart Grid, vol. 14, no. 5, pp. 4047-4059, Sept. 2023, doi: 10.1109/TSG.2023.3246459.

[2] Z. Zhao, G. Liu and Y. Liu, "Practical Privacy-Preserving Electricity Theft Detection for Smart Grid," in IEEE Transactions on Smart Grid, doi: 10.1109/TSG.2023.3349280.