当联邦学习保护数据隐私，怎么保证其自身的安全性？

发布时间：2022-06-30 16:50:02 所属栏目：安全来源：互联网

导读：联邦学习（Federated Learning）是一种由多方参与的联合计算技术，多方在不泄漏各自隐私数据的前提下，完成模型的训练与推理。 Vanilla 横向联邦学习的安全性 Vanilla 横向联邦是联邦学习的一种最初形态，由 Google 在 2016 年提出 [2]，该方案最早地展示了

　　联邦学习（Federated Learning）是一种由多方参与的联合计算技术，多方在不泄漏各自隐私数据的前提下，完成模型的训练与推理。

　　Vanilla 横向联邦学习的安全性
　　Vanilla 横向联邦是联邦学习的一种最初形态，由 Google 在 2016 年提出 [2]，该方案最早地展示了如何在不接触用户本地数据的前提下完成模型训练，从而在一定程度上减少了用户的隐私数据泄漏。

　　1.全连接网络层攻击

　　当神经网络模型第一层为全连接层时，中心服务器可以使用方法（1）进行攻击，假设第一层网络为：

　　a=wx+b

　　则在反向传播中，w 的梯度为：

　　
　　其中 ∂l/∂a 为反向传递到第一层的梯度，对每一个神经元，输出维度为 1，即 ∂l/∂a 为标量，∂l/∂w 是原数据 x 的 ∂l/∂a 倍。以图像数据为例，其数据区间为 0～255，中心服务器只需要将某一个神经元的梯度进行 rescale，调整到 0～255 之间，即可直接获得参与者的训练数据。

　　2.非全连接、深度模型的攻击

　　当模型为非全连接、深度模型时，例如卷积神经网络、循环网络，中心服务器可以使用方法（2）进行攻击，该方法的基本思路是使用梯度信息作为输入、训练一组假数据。当假数据产生的梯度和真实梯度相近时，假数据就会十分接近真实数据。下图 3 展示了该攻击方案的基本原理。

　　安全性分析（结论）：vanilla 横向联邦学习虽然避免了中心服务器直接接触用户数据，但仍无法保证用户的隐私数据安全，中心服务器在接收到用户的明文梯度后，可以使用梯度攻击模型恢复出用户的隐私数据。

　　多种保护机制下横向联邦学习的安全性
　　在 vanilla 横向联邦学习不安全成为共识的背景下，大量联邦学习数据保护方法被提出，下面我们将对最常用的两种进行讨论：（1）基于 Secure Aggregation 的横向联邦学习（2）基于同态加密的横向联邦学习。

　　基于 Secure Aggregation 的横向联邦学习
　　vanilla 横向联邦学习的隐私数据泄漏发生在中心服务器参数聚合的步骤中，中心服务器获得了每个参与者单独的梯度，进而可以使用梯度攻击窃取隐私数据。假设系统保障中心服务器无法获得单个参与者的梯度信息，即可很大程度保护参与者的数据，使得中心服务器无法对某一个参与者直接发起攻击。

　　Secure Aggregation 就是借助了这种思想，每个参与者在上传模型数据前，在自身的模型上加入大量噪声，然后控制噪声的分布，使得多个参与者的模型在聚合后，数据上的噪声会相互抵消，进而不会影响联邦学习的模型收敛。

　　
　　，中心服务器进行以下参数聚合：

　　
　　以上聚合公式也提供了准确性验证，即在聚合过程中，不同参与者模型上的扰动噪声会相互抵消、保证最终聚合模型不受影响。

　　安全性分析（结论）：在使用了 Secure Aggregation 方法后，中心服务器无法获得单个参与者的梯度信息，大大提升了系统的安全性，中心服务器也无法单独使用梯度攻击对参与者的隐私数据进行攻击。

（编辑：应用网_丽江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

之于勒索软件持乐观态	通往零信任的坦途 SAS
网络安全技术趋向	防范数据偷取从了解其