Vision Transformer for Intracranial Hemorrhage Classification in CT Scans Using an Entropy-Aware Fuzzy Integral Strategy for Adaptive Scan-Level Decision Fusion

作者: Mehdi Hosseini Chagahi, Niloufar Delfan, Behzad Moshiri, Md. Jalil Piran, Jaber Hatam Parikhan

发布时间: 2025-03-12

来源: arxiv

研究方向: 医学图像分析、脑出血分类、深度学习

主要内容

本文提出了一种基于金字塔视觉Transformer (PVT) 的模型,用于CT扫描中的脑出血分类。该模型结合了SHAP特征选择、模糊积分和熵感知决策融合策略,以提高分类准确性和可靠性。

主要贡献

1. 构建了一个包含多种脑出血亚型的脑CT扫描数据集,并进行了专家标注。

2. 引入了基于SHAP的特征选择方法,以识别最具判别性的特征。

3. 提出了一种熵感知模糊积分策略,用于跨多个CT切片的信息融合。

4. 实验结果表明,所提出的PVT模型在分类精度、精确度和鲁棒性方面显著优于现有的深度学习架构。

研究方法

1. 数据集收集和标注:从两个医疗中心收集脑CT扫描图像,并由专家进行标注。

2. 图像预处理:使用背景去除和二值掩码技术对CT扫描图像进行预处理。

3. 特征提取:使用PVT模型提取脑CT扫描图像的特征。

4. SHAP特征选择:使用SHAP分析识别最具判别性的特征。

5. 模糊积分决策融合:使用熵感知模糊积分策略融合多个CT切片的信息。

6. 分类器:使用提升神经网络进行脑出血亚型分类。

实验结果

实验结果表明,所提出的PVT模型在分类精度、精确度和鲁棒性方面显著优于现有的深度学习架构。此外,该方法还具有较低的计算复杂度,适用于临床应用。

未来工作

未来研究将集中在以下方面:多模态数据集成、自监督学习、不确定性感知决策融合、实时部署和优化、可解释性和临床验证。