ValuePilot: A Two-Phase Framework for Value-Driven Decision-Making
作者: Yitong Luo, Hou Hei Lam, Ziang Chen, Zhenliang Zhang, Xue Feng
发布时间: 2025-03-07
来源: arxiv
研究方向: 人工智能与价值驱动决策
主要内容
ValuePilot是一个两阶段的价值驱动决策框架,旨在解决人工智能在非训练数据集任务中个性化决策的挑战。该框架包括数据生成工具DGT和决策模块DMM,旨在通过模拟真实世界的任务场景和考虑个人价值偏好来提高决策质量。
主要贡献
1. 提出了一种新的价值驱动决策框架ValuePilot,通过数据生成和决策模块,使AI能够识别场景中的内在价值,计算行动可行性,并在多个价值维度之间进行权衡。
2. 通过实验证明,ValuePilot在模拟人类价值偏好方面与人类决策最为接近,优于Claude-3.5Sonnet、Gemini-2-flash、Llama-3.1-405b和GPT-4o。
3. 为AI系统提供了一种新的决策模式,使其能够根据个人价值偏好和情境进行个性化决策,从而提高决策质量和用户体验。
研究方法
1. 数据生成工具DGT:利用大型语言模型(LLMs)生成基于价值维度的场景,并通过自动化过滤技术和人工审核确保数据集的有效性。
2. 决策模块DMM:学习识别场景中的内在价值,计算行动可行性,并在多个价值维度之间进行权衡,以做出个性化决策。
3. T5模型:用于将文本描述的场景和行动转换为嵌入表示。
4. 多头自注意力机制:用于提取场景和行动之间的有意义关系。
5. MLP:用于将嵌入表示映射到场景和行动的价值分数。
6. PROMETHEE方法:用于对行动进行多标准决策分析,确保选定的行动与个人偏好一致。
实验结果
实验结果表明,ValuePilot在模拟人类价值偏好方面与人类决策最为接近,优于基线模型在选择情境感知、偏好一致的决策方面的表现。
未来工作
进一步研究ValuePilot在复杂场景和多层次价值冲突中的应用,探索如何将这种架构扩展以适应高度相互依赖的价值层次结构。此外,还需要开发能够捕捉人类价值观细微表达的跨文化验证和系统协议。