Is My Text in Your AI Model? Gradient-based Membership Inference Test applied to LLMs
作者: Gonzalo Mancera, Daniel de Alcala, Julian Fierrez, Ruben Tolosana, Aythami Morales
研究方向: 自然语言处理(NLP)与机器学习模型隐私保护
本文研究如何使用基于梯度的成员推理测试(gMINT)来检测特定文本是否被用于训练语言模型。该方法通过分析模型在训练过程中对数据样本的梯度反应,来识别数据样本是否属于训练集。