lyn7311的个人博客分享 http://blog.sciencenet.cn/u/lyn7311

博文

初五开工,龙年第一篇论文"面向联邦学习的可验证链式聚合" 精选

已有 6002 次阅读 2024-2-14 21:00 |系统分类:科研笔记

农村乡下,初五也称"破五",店铺开门营业。实际上,在我小时候,不少农民在初一上午把拜年搞完,下午就扛着锄头去给麦田锄草了。只有家境殷实的,才会等到初五后去劳作。

我就是天天扛着锄头下地的老农民,龙年的第一篇文章贴出来,供大家批评指正。

image.png

近年来,随着欧盟颁布《通用数据保护条例》和中国颁布《数据安全法》以及《个人信息保护法》,个人数据隐私问题备受关注。然而,在热播的电视剧《19层》中所呈现的情节却引发了更深层次的担忧。剧中描述了严某利用先进技术,通过植入芯片进入大脑的方式,窃取用户最私密的信息,将他们困于痛苦的回忆中。这个故事引发了人们对于数据安全的进一步思考,担忧个人数据可能被滥用或窃取的可能性。

尽管法律法规已经出台,但用户隐私泄露问题依然频频发生。这使得人们对于个人数据的保护仍然感到不安。《19层》所描述的情节提醒了我们,技术的进步可能会带来新的威胁,需要更加严密的监管和保护机制来保障用户的数据安全和隐私权。

2023年北海某网站存在数据泄露问题,约22万个人信息数据被挂在境外论坛售卖。发现公司网站服务器安全防护措施不足,仅能对SQL注入、XSSWebShell等简单攻击手段进行防御,网站存在被多个境外IP攻击入侵的情况。此外, 20235月,某提供导航服务的公司报案称,发现有人利用技术手段盗取公司服务器内全国的导航地图信息数据,并在论坛中售卖。

当然,数据传输到服务器过程中也面临着隐私泄露问题。在20231124日,医疗保健SaaS提供商Welltok发出警告,透露该公司所使用的文件传输程序在一次数据盗窃攻击中遭到黑客入侵,导致近850万美国患者的个人数据遭泄露。

为了充分发挥数据的价值且有效保护用户的隐私数据,联邦学习成了最佳选择方案。联邦学习中的每个用户将隐私数据保留在本地,通过与服务器交互参数来训练共享模型,不仅提升了数据的潜在价值,还解决了因直接传输敏感数据带来的隐私泄露问题。

目前,物联网中的轻量级设备,如传感器、执行器和可穿戴设备等,因其较低的处理能力、内存和能源消耗而受到限制。这些设备通常用于收集环境数据、监测设备状态或执行简单任务。由于资源有限,轻量级设备通常需要采用特定的通信协议和数据格式,以便与其他设备或云端系统进行高效通信。在设计中,必须谨慎考虑如何有效地管理能源,以延长电池寿命或减少能源消耗。因此,降低系统中的计算开销和通信开销至关重要。

数据隐私保护对于确保个人信息的安全和保密至关重要。在缺乏隐私保护的情况下,个人信息可能被滥用,导致身份盗窃、欺诈等问题。因此,对数据隐私的关注和保护对于维护个人的安全和自由至关重要。自2016年谷歌提出联邦学习以来,学术界一直关注联邦学习中的隐私问题,包括差分隐私方案和安全多方计算方案等。基于差分隐私的方案通过在本地模型中引入噪声以实现隐私保护,但噪声可能对模型准确率产生影响,需要在准确率和隐私保护之间取得平衡。基于安全多方计算的方案涉及与服务器多次通信,不可避免地增加参与者的通信开销。

正如前文所述的服务器信息泄露事件,随着服务器向外提供服务的增加,入侵风险也显著上升。服务器执行各种网络服务,不当操作可能导致安全风险和漏洞,从而增加单点故障的风险。同样,在联邦学习中,服务器也难以避免地面临单点故障的风险。因此,为确保整个系统的稳定性和安全性,必须采取措施降低这些风险并加强对数据隐私的保护。

“19游戏中,包含五个副本,游戏参与者需要通关五个副本并在最后一个副本中找到漏洞以破坏游戏,从而退出虚拟世界。类似于“19,联邦学习中同样面临隐私与安全问题。为此设计了一种安全可验证的链式聚合方案,称其为SVCA。该方案每次迭代包含五个回合,并在第五个回合判断服务器是否被攻击,从而判断其是否返回伪造的全局模型。主要工作如下:

l  SVCA 不仅可以保护用户模型参数的隐私,还可以支持不同地区整个群体的用户退出。 此外,SVCA架构简单,可以部署在资源有限的设备上。

l  为了保护聚合服务器免受单点故障的影响,SVCA使用哈达玛积来验证聚合结果的正确性,并使用承诺方案来保证验证过程的安全性。

l  SVCA采用分组传输,能显著降低普通用户的通信开销。此外,采用随机掩码保护参与者的数据隐私。

下图给出了SVCA的工作原理:

image.png

image.png

image.png

为了测试SVCA对模型分类性能的影响,文中实施了六个实验,分别为:MNIST MLP IID, MNIST MLP Non-IID, MNIST CNN IID, MNIST CNN Non-IID, CIFAR-10 MLP IID, CIFAR-10 CNN IID

image.png

image.png

image.png

最后,测试了SVCA与当前代表方案的性能,结果看出SVCA的参与者在计算和通信开销上表现突出,更适应于资源受限的设备。而在服务器端,为了避免其出现单点故障破坏联邦学习训练,增加了计算和通信开销。但由于服务器强大的计算和通信能力,实验结果均在可接受的范围内。

image.png

image.pngimage.png 

该研究工作已被期刊IEEE Internet of Things JournalIoTJ 2024)录用,作者为夏元俊博士生、刘忆宁教授,董仕教授,李萌教授以及郭成教授。

Yuanjun Xia, Yining Liu, Shi Dong, Meng Li and Cheng Guo, "SVCA: Secure and Verifiable Chained Aggregation for Privacy-Preserving Federated Learning," in IEEE Internet of Things Journal, doi: 10.1109/JIOT.2024.3363712.



https://blog.sciencenet.cn/blog-3464286-1421664.html

上一篇:语音采集中的篱笆墙
下一篇:21级硕士生赵志强在IEEE Trans on Smart Grid发表两篇论文
收藏 IP: 171.15.18.*| 热度|

15 宁利中 黄永义 闻宝联 王凌峰 褚海亮 罗汉江 郑永军 王成玉 姚小鸥 李学宽 吴斌 胡泽春 崔锦华 雷宏江 guest86505539

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-21 21:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部