CLIPure: Purification in Latent Space via CLIP for Adversarially Robust Zero-Shot Classification

作者: Mingkun Zhang, Keping Bi, Wei Chen, Jiafeng Guo, Xueqi Cheng

发布时间: 2025-02-27

来源: arxiv

研究方向: 计算机视觉，机器学习，对抗样本防御

主要内容

本文提出了一种名为CLIPure的对抗鲁棒零样本图像分类器，它基于CLIP模型，通过在CLIP的潜在空间中进行净化来提高对抗鲁棒性。

1. 提出了一种在CLIP的潜在空间中进行净化的新方法，提高了对抗鲁棒性。

2. 提出了两种CLIPure的变体：CLIPure-Diff和CLIPure-Cos，它们分别使用不同的方法来建模图像的潜在向量。

3. 在多个数据集上进行了实验，结果表明CLIPure显著提高了零样本分类的鲁棒性。

4. CLIPure-Cos是第一个不基于生成模型的无监督净化方法，显著提高了防御效率。

1. 使用双向随机微分方程（SDEs）来建模攻击和净化过程。

2. 使用KL散度来衡量净化风险。

3. 在CLIP的潜在空间中进行净化。

4. 使用DiffusionPrior模块和余弦相似度来建模图像的潜在向量。

5. 将潜在向量归一化以减少向量长度的影响。

CLIPure在CIFAR-10、ImageNet和13个数据集上进行了广泛的实验，结果表明它显著提高了零样本分类的鲁棒性。例如，在CIFAR10上，鲁棒性从71.7%提高到91.1%；在ImageNet上，鲁棒性从59.6%提高到72.6%。

未来工作可以探索在CLIP的潜在空间中进行净化在更广泛的应用中的潜力，例如视频分类和语音识别。