Revisiting Early Detection of Sexual Predators via Turn-level Optimization
作者: Jinmyeong An, Sangwon Ryu, Heejin Do, Yunsu Kim, Jungseul Ok, Gary Geunbae Lee
发布时间: 2025-03-11
来源: arxiv
研究方向: 网络安全,人工智能,机器学习,自然语言处理
主要内容
本文研究了在线诱拐(online grooming)的早期检测问题,提出了一种名为SCoRL(Speed Control Reinforcement Learning)的模型,通过结合速度控制强化学习和诱拐沟通理论(Luring Communication Theory)来提高早期检测的准确性和及时性。
主要贡献
1. 提出了一种基于强化学习的早期性侵者检测方法,利用速度控制奖励函数,通过转向级标签实现更细粒度的监督。
2. 引入了转向级早期性侵者检测(Turn-Level eSPD)作为新的基准,以更准确地评估模型性能。
3. 通过实验证明了SCoRL方法在早期性侵者检测任务中的优越性,在准确性和及时性方面均优于现有方法。
研究方法
1. 转向级风险标签(Turn-Level Risk Label):基于诱拐沟通理论,将对话分为不同阶段,并标注每个阶段的转向风险。
2. 速度控制强化学习(SCoRL):将转向级早期性侵者检测任务建模为马尔可夫决策过程(MDP),通过速度控制奖励函数优化早期检测点。
3. 转向级eSPD评估指标:包括转向级准确率、及时性和延迟加权F1分数,以平衡准确性和及时性。
实验结果
实验结果表明,SCoRL在PANC数据集上显著优于现有方法,在准确性和及时性方面均有显著提升。此外,SCoRL在减少误报方面也表现出优越性能。
未来工作
未来工作将关注以下方面:1)扩大数据集,以包含更多样化的诱拐策略;2)考虑受害者的状态和对话行为,以提供更丰富的上下文信息;3)将SCoRL应用于真实场景,以验证其在实际应用中的有效性。