Retrieval Augmented Generation for Topic Modeling in Organizational Research: An Introduction with Empirical Demonstration

作者: Gerion Spielberger, Florian Artinger, Jochen Reb, Rudolf Kerschreiter

发布时间: 2025-03-03

来源: arxiv

研究方向: 组织研究中的文本数据分析与主题建模

主要内容

本文提出了一种名为Agentic RAG的文本数据分析方法,用于组织研究中的主题建模。该方法结合了检索、生成和代理驱动的学习三个关键组件,以提高主题建模的效率、透明度、有效性和可靠性。

主要贡献

1. 将Agentic RAG引入组织研究,并详细阐述了其在主题建模方面相较于传统方法和基于LLM的提示方法的改进。

2. 通过实证评估Agentic RAG的有效性和可靠性,提供了关于其有效性的可衡量证据。

研究方法

1. Agentic RAG:结合检索、生成和代理驱动的学习。

2. 主题建模:使用LDA和LLM提示。

3. 实证研究:在COVID-19疫苗犹豫不决的Twitter数据集上进行分析。

4. 评估指标:使用余弦相似度评估主题的有效性和可靠性。

实验结果

实验结果表明,与LDA和基于LLM的提示方法相比,Agentic RAG在主题的有效性和可靠性方面表现更好。Agentic RAG生成的主题与数据集更加相关,并且在多次迭代中表现出高度一致性。

未来工作

未来研究可以探索不同LLM代理、替代数据集和多样化的LLM架构。此外,还应进一步研究如何通过LLM代理增强数据分析过程,并探索多模态数据分析的潜力。