Enhancing NLP Robustness and Generalization through LLM-Generated Contrast Sets: A Scalable Framework for Systematic Evaluation and Adversarial Training

作者: Hender Lin

发布时间: 2025-03-11

来源: arxiv

研究方向: 自然语言处理(NLP)的鲁棒性和泛化能力提升

主要内容

本研究利用大型语言模型(LLM)自动化生成多样化的对比集，以评估和提升NLP模型的鲁棒性和泛化能力。通过在SNLI数据集上创建3000个实例的对比集，研究评估了在对抗训练中模型的表现，并探讨了其对抗未见过的扰动的能力。

1. 提出了一种利用LLM自动化生成对比集的方法，解决了传统对比集生成劳动密集和多样性有限的问题。

2. 通过对抗训练在LLM生成的对比集上微调模型，显著提高了模型在扰动数据集上的性能，同时保持了标准测试集上的准确率。

3. 验证了LLM生成的对比集在提升模型泛化能力到未见过的扰动方面的有效性。

1. 利用LLM（Google Gemini 1.5 Pro）自动化生成多样化的对比集。

2. 在LLM生成的对比集上对ELECTRA-small模型进行微调。

3. 通过对比三个数据集（原始测试集、原始对比集和新对比集）来评估模型的表现。

4. 使用混淆矩阵进行错误分析，以深入了解模型的行为。

实验结果表明，LLM生成的对比集能够有效地评估NLP模型的鲁棒性，并通过对抗训练显著提高了模型在扰动数据集上的性能，同时保持了标准测试集上的准确率。此外，模型在未见过的扰动上的泛化能力也得到了提升。

未来工作可以包括对更广泛的NLP任务进行研究，探索LLM在更多领域中的应用。此外，还可以研究如何进一步提高对比集生成的质量和多样性，以及如何改进对抗训练的方法。