MathMistake Checker: A Comprehensive Demonstration for Step-by-Step Math Problem Mistake Finding by Prompt-Guided LLMs
作者: Tianyang Zhang, Zhuoxuan Jiang, Haotian Zhang, Lin Lin, Shaohua Zhang
发布时间: 2025-03-07
来源: arxiv
研究方向: 教育技术,人工智能,数学教育
主要内容
提出了一种名为MathMistake Checker的系统,用于自动化检测数学问题中的错误,特别是那些需要逐步验证答案的问题。该系统旨在通过两阶段过程提高评分效率,并从教学角度提升学习体验。
主要贡献
1. 开发了一种无需参考答案的自动评分系统,能够识别和评估学生多样化的解题方法。
2. 结合了计算机视觉和大型语言模型(LLMs)的链式思维能力,实现了对数学答案的端到端评分。
3. 引入了教育链式思维(PedCoT)提示策略,能够逐步识别学生答案中的逻辑错误。
4. 通过系统分析学生的解题过程,提供有针对性的反馈,以帮助学生理解错误并提高学习效果。
研究方法
1. 光学字符识别(OCR)模块,包括文本行语义分割、专业文本识别、文档布局分析和顺序检测。
2. 使用大型语言模型(LLMs)进行逐步评分,包括再生和预测、提取和比较以及评估和评论三个阶段。
3. 教育链式思维(PedCoT)提示策略,用于引导学生逐步思考和解决问题。
实验结果
MathMistake Checker已在多种类型的数学问题中进行了测试,包括计算和文字问题,并显示出良好的效果。
未来工作
将系统扩展到其他学科,并提高反馈质量,以进一步促进个性化学习和教学效率的提升。