Exploring LLM Agents for Cleaning Tabular Machine Learning Datasets
作者: Tommaso Bendinelli, Artur Dox, Christian Holz
发布时间: 2025-03-11
来源: arxiv
研究方向: 机器学习数据清洗与大型语言模型(LLM)应用
主要内容
研究LLM在数据清洗中的作用,通过实验验证LLM在识别和纠正数据集中的错误,以提高机器学习模型性能的能力。
主要贡献
1. 提出了一种评估LLM在数据清洗任务中能力的框架。
2. 通过实验证明了LLM可以识别和纠正数据集中的错误,从而提高模型性能。
3. 分析了LLM在数据清洗任务中的优势和局限性。
4. 为未来LLM在数据清洗领域的应用提供了参考和启示。
研究方法
1. 构建了包含错误的数据集,用于评估LLM的数据清洗能力。
2. 使用LLM与Python交互,通过IPython执行代码,修改数据集。
3. 通过模型在测试集上的性能来评估LLM修改后的数据集。
4. 对实验结果进行了定量和定性分析。
实验结果
LLM在识别和纠正数据集中的错误方面表现良好,但难以处理跨多行的复杂错误,如趋势和偏差。提供错误提示可以显著提高LLM的性能。
未来工作
探索LLM接收视觉信息的能力,如图表,以增强数据探索过程。自动化错误生成,以创建更多样化和现实的数据集。自动化分析过程,以量化LLM的失败类型和发生频率。研究不同提示方法对LLM性能和错误处理策略的影响。