Bot Wars Evolved: Orchestrating Competing LLMs in a Counterstrike Against Phone Scams

作者: Nardine Basta, Conor Atkins, Dali Kaafar

发布时间: 2025-03-11

来源: arxiv

研究方向: 人工智能在网络安全领域的应用,特别是在对抗电话诈骗方面

主要内容

本文提出了一种名为“Bot Wars”的框架,该框架利用大型语言模型(LLMs)模拟诈骗对抗,通过模拟对抗性对话来对抗电话诈骗。该框架通过链式思维推理和双层提示架构,使LLMs能够创造具有人口统计学真实性的受害者角色,同时保持战略连贯性。

主要贡献

1. 提出了一个无需显式优化的策略出现的形式化基础,通过提示架构和链式思维推理来实现策略出现,将传统和提示驱动的对话系统相结合。

2. 设计了一种双层提示架构,使LLMs能够创造具有人口统计学真实性的受害者角色。

3. 创建了一个包含3200个诈骗对话的数据集,这些对话通过与179小时的真人诈骗诱骗互动进行验证。

4. 开发了一个综合评估框架,通过认知、定量和内容特定指标量化对话的有效性。

研究方法

1. 大型语言模型(LLMs)的链式思维推理

2. 双层提示架构

3. 内容分析框架

4. 认知评估框架

5. 定量指标框架

6. 内容特定分析框架

实验结果

实验表明,GPT-4在对话自然性和角色真实性方面表现出色,而Deepseek在参与可持续性方面表现出色。

未来工作

未来研究可以进一步探索提高LLMs在对抗电话诈骗方面的效果,包括提高LLMs在复杂对话中的策略适应性和持续参与能力。