Exploring LLM Agents for Cleaning Tabular Machine Learning Datasets

作者: Tommaso Bendinelli, Artur Dox, Christian Holz

发布时间: 2025-03-11

来源: arxiv

研究方向: 机器学习数据清洗与大型语言模型（LLM）应用

主要内容

研究LLM在数据清洗中的作用，通过实验验证LLM在识别和纠正数据集中的错误，以提高机器学习模型性能的能力。

1. 提出了一种评估LLM在数据清洗任务中能力的框架。

2. 通过实验证明了LLM可以识别和纠正数据集中的错误，从而提高模型性能。

3. 分析了LLM在数据清洗任务中的优势和局限性。

4. 为未来LLM在数据清洗领域的应用提供了参考和启示。

1. 构建了包含错误的数据集，用于评估LLM的数据清洗能力。

2. 使用LLM与Python交互，通过IPython执行代码，修改数据集。

3. 通过模型在测试集上的性能来评估LLM修改后的数据集。

4. 对实验结果进行了定量和定性分析。

LLM在识别和纠正数据集中的错误方面表现良好，但难以处理跨多行的复杂错误，如趋势和偏差。提供错误提示可以显著提高LLM的性能。

探索LLM接收视觉信息的能力，如图表，以增强数据探索过程。自动化错误生成，以创建更多样化和现实的数据集。自动化分析过程，以量化LLM的失败类型和发生频率。研究不同提示方法对LLM性能和错误处理策略的影响。