TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection

作者: Zhiming Ma, Peidong Wang, Minhua Huang, Jingpeng Wang, Kai Wu, Xiangzhao Lv, Yachun Pang, Yin Yang, Wenjie Tang, Yuchen Kang

发布时间: 2025-04-03

来源: arxiv

研究方向: 电信欺诈检测与防欺诈系统

主要内容

本文提出并构建了TeleAntiFraud-28k,这是一个专门为电信欺诈检测设计的开源音频-文本慢思考数据集。该数据集通过三种策略构建:隐私保护文本真实样本生成、语义增强和基于多代理对抗合成的模拟欺诈策略。数据集包含28,511个经过严格处理的语音-文本对,并分为场景分类、欺诈检测和欺诈类型分类三个任务。此外,还构建了TeleAntiFraud-Bench评估基准,用于评估模型在电信欺诈检测任务中的性能。

主要贡献

1. 提出了第一个多任务慢思考音频语言数据集(TeleAntiFraud-28k)用于电信欺诈预防

2. 设计了一个新的数据生成流程,通过真实通话ASR处理、LLM模拟和基于多代理对抗生成最大化覆盖各种欺诈场景

3. 建立了TeleAntiFraud-Bench评估基准,为电信欺诈检测模型提供标准化测试标准

4. 在多个领先的大音频语言模型(LALM)上进行了综合评估,验证了数据集的训练有效性并建立了基于音频的欺诈研究性能基准

研究方法

1. 使用自动语音识别(ASR)技术将匿名通话录音转录为文本样本

2. 使用文本到语音(TTS)模型再生样本,确保与真实世界的语言表达一致

3. 基于大型语言模型(LLM)的自主指令采样来增强语义并丰富生成内容

4. 设计了一个多代理对抗框架,通过预定义的通信场景和欺诈类型来模拟新兴的欺诈策略

5. 使用慢思考机制模拟反欺诈专家的分析过程和专业知识

6. 构建了TeleAntiFraud-Bench评估基准,用于比较不同模型在电信场景分类、欺诈检测和欺诈类型分类方面的性能

实验结果

实验结果表明,未经微调的LALM在电信反欺诈任务中表现不足。经过在TeleAntiFraud-28k训练集上微调Qwen2Audio后,在TeleAntiFraud-Bench测试集上观察到性能显著提高。这表明该数据集在开发基于音频的反欺诈模型方面的有效性和实用性。

未来工作

未来工作将集中在以下几个方面:提高特定欺诈类型的识别能力,提高数据多样性,扩展到多语言和方言支持,优化数据集和模型以增强对新欺诈策略的识别能力,并扩展到更多语言和应用场景,进一步提高语音语言模型在反欺诈工作中的作用。