FaceID-6M: A Large-Scale, Open-Source FaceID Customization Dataset

作者: Shuhe Wang, Xiaoya Li, Jiwei Li, Guoyin Wang, Xiaofei Sun, Bob Zhu, Han Qiu, Mo Yu, Shengjie Shen, Tianwei Zhang, Eduard Hovy

发布时间: 2025-03-12

来源: arxiv

研究方向: 人脸识别定制化(FaceID Customization)和数据集构建

主要内容

FaceID-6M是一个大规模、开源的人脸识别定制化数据集,包含600万高质量文本-图像对。该数据集从LAION-5B中筛选而来,经过严格的图像和文本过滤过程,以确保数据集质量,旨在为训练强大的FaceID定制化模型提供高质量的数据支持。

主要贡献

1. 收集并发布了首个大规模、开源的FaceID定制化数据集FaceID-6M。

2. 使代码、数据集和模型完全公开,以支持FaceID定制化社区的研究和进步。

3. 在FaceID-6M数据集上训练的模型性能与现有工业模型相当,甚至在某些方面表现更好。

研究方法

1. 从LAION-5B中收集大量文本-图像对。

2. 语言过滤:仅保留英语文本-图像对。

3. 图像过滤:移除不满足FaceID定制化任务要求的图像,如无人脸图像、模糊或遮挡的图像等。

4. 文本过滤:移除与FaceID应用无关或误导性的文本描述。

5. 使用扩散模型进行FaceID定制化模型的训练。

6. 进行实验,包括直接生成比较、定量评估和人工评估,以验证FaceID-6M的有效性。

实验结果

实验结果表明,在FaceID-6M数据集上训练的模型在FaceID保真度方面与现有工业模型相当,甚至在某些方面表现更好。此外,人工评估也证实了模型在提示对齐、FaceID保真度和图像质量方面的改进。

未来工作

未来研究可以探索如何进一步提高FaceID定制化模型的性能,并研究如何将FaceID-6M数据集应用于其他领域,如人机交互、虚拟现实和增强现实等。