Efficient Membership Inference Attacks by Bayesian Neural Network

作者: Zhenlong Liu, Wenyu Jiang, Feng Zhou, Hongxin Wei

发布时间: 2025-03-11

来源: arxiv

研究方向: 机器学习，隐私保护，成员推理攻击

主要内容

本文提出了一种基于贝叶斯神经网络的成员推理攻击方法（BMIA），旨在通过贝叶斯推理进行条件攻击，以估计特定数据点是否被用于给定模型的训练。该方法通过拉普拉斯近似将参考模型转换为贝叶斯神经网络，从而直接估计条件得分分布。

1. 提出了BMIA，一种高效且鲁棒的成员推理攻击方法。

2. 从不确定性估计的角度讨论了QMIA的局限性，并从理论上分析了条件攻击的成功原因。

3. 在多个数据集上进行了广泛的实验，证明了BMIA在较低计算成本下能够达到具有竞争力的结果。

1. 贝叶斯神经网络（BNN）

2. 拉普拉斯近似（LA）

3. 局部线性化

4. Hessian近似

5. 边际似然最大化

在五个数据集上的实验表明，BMIA在低错误接受率下实现了较高的真正例率，并且计算效率高于现有方法。在CIFAR-100数据集上，BMIA在1%的错误接受率下比LiRA（n=8）实现了64%更高的真正例率。

考虑使用混合拉普拉斯近似来提高方法在计算资源丰富的情况下的性能。