MathMistake Checker: A Comprehensive Demonstration for Step-by-Step Math Problem Mistake Finding by Prompt-Guided LLMs

作者: Tianyang Zhang, Zhuoxuan Jiang, Haotian Zhang, Lin Lin, Shaohua Zhang

发布时间: 2025-03-07

来源: arxiv

研究方向: 教育技术，人工智能，数学教育

主要内容

提出了一种名为MathMistake Checker的系统，用于自动化检测数学问题中的错误，特别是那些需要逐步验证答案的问题。该系统旨在通过两阶段过程提高评分效率，并从教学角度提升学习体验。

1. 开发了一种无需参考答案的自动评分系统，能够识别和评估学生多样化的解题方法。

2. 结合了计算机视觉和大型语言模型（LLMs）的链式思维能力，实现了对数学答案的端到端评分。

3. 引入了教育链式思维（PedCoT）提示策略，能够逐步识别学生答案中的逻辑错误。

4. 通过系统分析学生的解题过程，提供有针对性的反馈，以帮助学生理解错误并提高学习效果。

1. 光学字符识别（OCR）模块，包括文本行语义分割、专业文本识别、文档布局分析和顺序检测。

2. 使用大型语言模型（LLMs）进行逐步评分，包括再生和预测、提取和比较以及评估和评论三个阶段。

3. 教育链式思维（PedCoT）提示策略，用于引导学生逐步思考和解决问题。

MathMistake Checker已在多种类型的数学问题中进行了测试，包括计算和文字问题，并显示出良好的效果。

将系统扩展到其他学科，并提高反馈质量，以进一步促进个性化学习和教学效率的提升。