[LG]《Learning to Make MISTAKEs: Modeling Incorrect Student Thinking And Key Errors》A Ross, J Andreas [MIT CSAIL] (2025)
提出了一种创新方法mistake(Modeling Incorrect Student Thinking And Key Errors),专注于建模学生的错误思维和关键错误,推动教育AI向更精准个性化方向发展。
核心理念:
mistake方法通过“循环一致性”原理,自动生成带有潜在误解的高质量合成错误推理数据,进而训练两个模型:
1. 学生模拟模型:基于特定误解,模拟学生的错误推理与答案。
2. 误解推断模型:从学生错误答案推断其内在误解。
技术细节:
- mistake-Generate:无监督生成错误数据,包括采样错误答案、推断误解、模拟学生思考、循环一致性校验四步。
- mistake-Update:迭代训练上述两个模型,利用新生成数据不断优化,形成闭环提升。
实验验证:
在EEDI矿藏数学误解数据集(约1857道K-12数学题)上,mistake方法在三项关键任务均表现出显著提升:
1. 学生模拟准确度提升约9%,更精准再现学生错解。
2. 误解推断性能提升约15%,更有效识别学生思维漏洞。
3. 诱导选项(干扰项)生成精度提升64.6%,生成的错误选项更贴近专家设计。
此外,mistake生成的循环一致性筛选机制可直接应用于GPT-4等大模型,显著提升其诱导选项质量,体现出极强的通用性与实用价值。
意义与展望:
传统语言模型多聚焦于正确推理,mistake开辟了模拟错误推理的新路径,适用于教育中实时反馈、教师培训、测评设计等场景。未来可与对话式导师结合,实现针对学生误解的个性化教学,也可推广至心理学、经济学等领域模拟认知偏差。
完整论文链接:arxiv.org/abs/2510.11502
教育AI 学生误解建模 语言模型 个性化教学 AI辅导