FinTMMBench: Benchmarking Temporal-Aware Multi-Modal RAG in Finance
作者: Fengbin Zhu, Junfeng Li, Liangming Pan, Wenjie Wang, Fuli Feng, Chao Wang, Huanbo Luan, Tat-Seng Chua
发布时间: 2025-03-10
来源: arxiv
研究方向: 金融领域的时间感知多模态检索增强生成(RAG)
主要内容
该研究提出了FinTMMBench,一个用于评估金融分析中时间感知多模态RAG系统的基准。FinTMMBench包含了来自多个模态(表格、新闻文章、股票价格和图表)的7380个问题,旨在评估模型在检索和推理时间敏感金融信息方面的能力。为了解决FinTMMBench的挑战,研究人员提出了TMMHybridRAG,这是一种结合密集和图检索以及时间感知实体建模的新方法。
主要贡献
1. 首次研究了金融领域的时间感知多模态RAG,解决了金融分析中的关键现实需求。
2. 引入了新的基准FinTMMBench,专门用于评估金融领域的时间感知多模态RAG系统。
3. 提出了TMMHybridRAG,这是一种新颖的时间感知多模态RAG方法,结合了密集和图检索技术。
研究方法
1. 模板引导的生成方法
2. 多模态大型语言模型(LLM)
3. 密集检索和图检索技术
4. 时间感知实体建模
实验结果
TMMHybridRAG在所有评估指标上均优于基线方法,证明了其在解决FinTMMBench挑战方面的优越性。然而,F1分数相对较低(23.71),突显了FinTMMBench中存在的挑战,并强调了需要开发更先进的RAG方法。
未来工作
希望FinTMMBench能够作为一个有价值的资源,推动构建稳健且可解释的时间感知多模态金融RAG系统。未来的工作可能包括改进检索和推理方法,以及探索更复杂的金融任务和模态。