CLIPure: Purification in Latent Space via CLIP for Adversarially Robust Zero-Shot Classification

作者: Mingkun Zhang, Keping Bi, Wei Chen, Jiafeng Guo, Xueqi Cheng

发布时间: 2025-02-27

来源: arxiv

研究方向: 计算机视觉,机器学习,对抗样本防御

主要内容

本文提出了一种名为CLIPure的对抗鲁棒零样本图像分类器,它基于CLIP模型,通过在CLIP的潜在空间中进行净化来提高对抗鲁棒性。

主要贡献

1. 提出了一种在CLIP的潜在空间中进行净化的新方法,提高了对抗鲁棒性。

2. 提出了两种CLIPure的变体:CLIPure-Diff和CLIPure-Cos,它们分别使用不同的方法来建模图像的潜在向量。

3. 在多个数据集上进行了实验,结果表明CLIPure显著提高了零样本分类的鲁棒性。

4. CLIPure-Cos是第一个不基于生成模型的无监督净化方法,显著提高了防御效率。

研究方法

1. 使用双向随机微分方程(SDEs)来建模攻击和净化过程。

2. 使用KL散度来衡量净化风险。

3. 在CLIP的潜在空间中进行净化。

4. 使用DiffusionPrior模块和余弦相似度来建模图像的潜在向量。

5. 将潜在向量归一化以减少向量长度的影响。

实验结果

CLIPure在CIFAR-10、ImageNet和13个数据集上进行了广泛的实验,结果表明它显著提高了零样本分类的鲁棒性。例如,在CIFAR10上,鲁棒性从71.7%提高到91.1%;在ImageNet上,鲁棒性从59.6%提高到72.6%。

未来工作

未来工作可以探索在CLIP的潜在空间中进行净化在更广泛的应用中的潜力,例如视频分类和语音识别。