PAARS: Persona Aligned Agentic Retail Shoppers

作者: Saab Mansour, Leonardo Perelli, Lorenzo Mainetti, George Davidson, Stefano D'Amato

发布时间: 2025-04-02

来源: arxiv

研究方向: 电子商务领域的人机行为模拟与数据分析

主要内容

该研究提出了PAARS框架,通过利用LLM驱动的代理来模拟人类购物行为,并通过个体和群体层面的对齐套件确保其可靠性。该框架通过从匿名历史购物数据中自动挖掘角色,为代理配备零售特定工具来模拟购物会话,并引入了一个新颖的对齐套件来衡量人类和购物代理在群体(即人口)层面的分布差异。

主要贡献

1. 提出了PAARS框架,用于模拟人类购物行为。

2. 引入了角色驱动的模拟方法,通过从历史购物数据中挖掘角色来为代理提供个性化。

3. 设计了个体和群体层面的对齐套件,以评估代理行为与人类行为的一致性。

4. 展示了PAARS在自动化代理A/B测试中的应用,并将其与人类结果进行了比较。

5. 提出了对齐评估套件,旨在评估代理人口近似人类人口的程度。

6. 通过实验证明了使用角色可以改善对齐套件的性能,尽管与人类行为之间存在差距。

研究方法

1. 角色挖掘:从匿名历史购物数据中自动挖掘角色。

2. 代理生成:利用LLM驱动的代理,为代理配备零售特定工具来模拟购物会话。

3. 对齐评估:通过个体和群体层面的对齐套件来评估代理行为与人类行为的一致性。

4. A/B测试模拟:使用PAARS模拟历史A/B测试,以评估其有效性。

实验结果

实验结果表明,使用角色可以改善对齐套件的性能,尽管与人类行为之间存在差距。在A/B测试模拟中,测量了销售变化的方向性一致性,尽管模拟环境的销售变化幅度较大。

未来工作

改进角色和会话生成能力,以确保与人类行为的一致性。扩展对齐套件,包括更细致的测试,如细微的文化评估和额外的任务,如导航或过滤体验。对LLM进行根本测试,特别是对较小模型,包括对价格变化、评论评分和品牌偏差的敏感性测试。将框架扩展到全球市场,包括测试文化细微差别和表示多样化全球购物人群的模型保真度。包括视觉模态并利用多模态LLM,以实现更准确的模拟。持续更新合成角色,以反映现实世界的转变。