DatawiseAgent: A Notebook-Centric LLM Agent Framework for Automated Data Science

作者: Ziming You, Yumiao Zhang, Dexuan Xu, Yiwei Lou, Yandong Yan, Wei Wang, Huaming Zhang, Yu Huang

发布时间: 2025-03-11

来源: arxiv

研究方向: 数据科学自动化与大型语言模型应用

主要内容

DatawiseAgent是一个基于笔记本中心的大型语言模型(LLM)代理框架,旨在自动化数据科学任务。该框架通过整合用户、代理和计算环境之间的交互,支持灵活和自适应的自动化数据科学。

主要贡献

1. 提出了一种基于笔记本中心的大型语言模型代理框架,统一了用户、代理和计算环境之间的交互。

2. 设计了一个基于有限状态转换器(FST)的多阶段设计,包括深度优先搜索(DFS)-样规划、增量执行、自调试和后过滤。

3. 通过实验验证了DatawiseAgent在数据分析和数据建模等任务中的有效性和优越性。

4. 证明了DatawiseAgent能够以较低的成本实现出色的性能,并且比现有的方法更加高效和准确。

研究方法

1. 有限状态转换器(FST)

2. 深度优先搜索(DFS)-样规划

3. 增量执行

4. 自调试

5. 后过滤

6. 笔记本中心的设计

7. 大型语言模型(LLM)

实验结果

DatawiseAgent在数据分析和数据建模等任务中表现出色,与最先进的基线方法相比,其性能始终如一或优于基线方法。实验结果表明,DatawiseAgent在数据分析和数据建模任务中具有更高的准确率和任务成功率,并且能够以较低的成本实现出色的性能。

未来工作

未来工作将集中在以下几个方面:1. 扩展DatawiseAgent的功能,使其能够处理更多类型的数据科学任务;2. 研究如何进一步优化DatawiseAgent的性能;3. 探索将DatawiseAgent应用于其他领域,如生物信息学、金融分析等。