AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection
作者: Jialin Lu, Junjie Shan, Ziqi Zhao, Ka-Ho Chow
发布时间: 2025-03-11
来源: arxiv
研究方向: 网络安全,人工智能,计算机视觉
主要内容
本文研究了一种名为AnywhereDoor的多目标后门攻击方法,用于对象检测模型。该方法允许攻击者在推理时动态地控制目标模型的行为,包括使对象消失、创建新对象或错误标记对象。
主要贡献
1. 介绍了AnywhereDoor,这是第一个强调对对象检测模型灵活控制的恶意攻击方法。
2. 提出了目标解耦,通过分解和组合攻击效果来扩展攻击目标的数量。
3. 引入了触发拼贴,以确保即使在基于区域的检测器中也能保持鲁棒性。
4. 提出了战略批处理,以解决对象级数据不平衡问题,这些问题阻碍了攻击。
5. 在多个对象检测算法和数据集上进行了广泛的实验,证明了AnywhereDoor的有效性,攻击成功率提高了26%。
研究方法
1. 训练过程中使用脏标签数据投毒范式。
2. 引入了战略批处理,以解决数据不平衡问题。
3. 提出了目标解耦,将攻击目标分解为删除和生成两个组件。
4. 引入了触发拼贴,确保触发器在图像的子区域中有效。
5. 采用了联合优化,以优化受害者模型和触发生成器。
实验结果
实验结果表明,AnywhereDoor在多种对象检测算法和数据集上均取得了显著的攻击成功率,同时保持了模型在干净样本上的性能。
未来工作
未来工作可以基于AnywhereDoor的框架,开发更先进的后门攻击和相应的防御机制。这包括动态和上下文感知的攻击场景,其中触发器根据特定输入或检测任务进行调整。