Improving Hate Speech Classification with Cross-Taxonomy Dataset Integration
作者: Jan Fillies, Adrian Paschke
发布时间: 2025-03-10
来源: arxiv
研究方向: 仇恨言论检测与分类
主要内容
该研究旨在通过整合不同定义和标注的仇恨言论数据集,提高仇恨言论检测的准确性和效率。研究提出了一个通用的仇恨言论分类法和一个分类器,能够在一个框架内检测多种定义的仇恨言论。
主要贡献
1. 提出了一个通用的仇恨言论分类法,能够整合不同的仇恨言论定义。
2. 开发了一个仇恨言论分类器,能够在一个框架内检测多种定义的仇恨言论。
3. 通过整合两个不同标注的数据集,验证了该方法的可行性,并提高了分类性能。
4. 为仇恨言论检测提供了一个新的研究方向,即数据集和分类法整合。
5. 提高了仇恨言论检测的效率和准确性,减少了对多个专门分类器的依赖。
研究方法
1. 通用分类法构建:将现有的分类法合并成一个通用的分类法。
2. 多标签分类器训练:使用预训练的语言模型,基于通用分类法进行多标签分类器的训练。
3. 数据集整合:将不同标注的数据集整合到一个统一的标注方案中。
4. 迭代训练:通过迭代训练,逐步提高分类器的性能。
5. 评估:使用独立测试集评估分类器的性能。
实验结果
实验结果表明,通过整合不同的数据集和分类法,可以显著提高仇恨言论检测的准确性和效率。在独立测试集上的评估结果显示,该方法能够有效地检测多种定义的仇恨言论。
未来工作
未来工作将包括以下方面:探索自动匹配分类法的方法,包括基于定义的匹配和检测不匹配;验证更多种类的仇恨言论分类法,并可能创建一个仇恨言论本体;通过本体编码结构知识,提高分类器的泛化能力;研究偏见缓解和质量保证问题。