Exploring LLM Agents for Cleaning Tabular Machine Learning Datasets

作者: Tommaso Bendinelli, Artur Dox, Christian Holz

发布时间: 2025-03-11

来源: arxiv

研究方向: 机器学习数据清洗与大型语言模型(LLM)应用

主要内容

研究LLM在数据清洗中的作用,通过实验验证LLM在识别和纠正数据集中的错误,以提高机器学习模型性能的能力。

主要贡献

1. 提出了一种评估LLM在数据清洗任务中能力的框架。

2. 通过实验证明了LLM可以识别和纠正数据集中的错误,从而提高模型性能。

3. 分析了LLM在数据清洗任务中的优势和局限性。

4. 为未来LLM在数据清洗领域的应用提供了参考和启示。

研究方法

1. 构建了包含错误的数据集,用于评估LLM的数据清洗能力。

2. 使用LLM与Python交互,通过IPython执行代码,修改数据集。

3. 通过模型在测试集上的性能来评估LLM修改后的数据集。

4. 对实验结果进行了定量和定性分析。

实验结果

LLM在识别和纠正数据集中的错误方面表现良好,但难以处理跨多行的复杂错误,如趋势和偏差。提供错误提示可以显著提高LLM的性能。

未来工作

探索LLM接收视觉信息的能力,如图表,以增强数据探索过程。自动化错误生成,以创建更多样化和现实的数据集。自动化分析过程,以量化LLM的失败类型和发生频率。研究不同提示方法对LLM性能和错误处理策略的影响。