Retrieval Augmented Generation for Topic Modeling in Organizational Research: An Introduction with Empirical Demonstration
作者: Gerion Spielberger, Florian Artinger, Jochen Reb, Rudolf Kerschreiter
发布时间: 2025-03-03
来源: arxiv
研究方向: 组织研究中的文本数据分析与主题建模
主要内容
本文提出了一种名为Agentic RAG的文本数据分析方法,用于组织研究中的主题建模。该方法结合了检索、生成和代理驱动的学习三个关键组件,以提高主题建模的效率、透明度、有效性和可靠性。
主要贡献
1. 将Agentic RAG引入组织研究,并详细阐述了其在主题建模方面相较于传统方法和基于LLM的提示方法的改进。
2. 通过实证评估Agentic RAG的有效性和可靠性,提供了关于其有效性的可衡量证据。
研究方法
1. Agentic RAG:结合检索、生成和代理驱动的学习。
2. 主题建模:使用LDA和LLM提示。
3. 实证研究:在COVID-19疫苗犹豫不决的Twitter数据集上进行分析。
4. 评估指标:使用余弦相似度评估主题的有效性和可靠性。
实验结果
实验结果表明,与LDA和基于LLM的提示方法相比,Agentic RAG在主题的有效性和可靠性方面表现更好。Agentic RAG生成的主题与数据集更加相关,并且在多次迭代中表现出高度一致性。
未来工作
未来研究可以探索不同LLM代理、替代数据集和多样化的LLM架构。此外,还应进一步研究如何通过LLM代理增强数据分析过程,并探索多模态数据分析的潜力。