PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization

作者: Alexis Guichemerre, Soufiane Belharbi, Mohammadhadi Shateri, Luke McCaffrey, Eric Granger

发布时间: 2025-04-03

来源: arxiv

研究方向: 弱监督目标定位(WSOL)和病理图像分析

主要内容

PixelCAM是一种用于病理图像分类和ROI定位的WSOL方法。它通过在图像编码器的像素特征空间中同时训练分类和定位任务来解决异步收敛问题。PixelCAM使用部分交叉熵,通过从预训练的WSOL模型中收集的像素伪标签进行训练,并将其集成到CNN和Transformer架构中,而无需任何修改。

主要贡献

1. 提出了PixelCAM,这是一种用于WSOL的全新多任务方法。

2. 通过在像素特征空间中同时训练分类和定位任务,PixelCAM解决了异步收敛问题。

3. PixelCAM提高了分类和定位的性能,并且对OOD数据具有鲁棒性。

4. PixelCAM可以轻松集成到CNN和Transformer架构中,而无需修改。

研究方法

1. 多任务学习

2. 像素级分类器

3. 预训练WSOL模型

4. 部分交叉熵

5. 标准梯度下降

实验结果

在GlaS和CAMELYON16数据集上的实验表明,PixelCAM可以改善WSOL方法的分类和定位性能。它还在具有大域差异的OOD数据上提供了鲁棒性。

未来工作

PixelCAM的进一步改进包括更好地优化两个任务,同时减少它们之间的相互负面影响,以及解决WSOL场景中的OOD问题。