Rubrik's Cube: Testing a New Rubric for Evaluating Explanations on the CUBE dataset
作者: Diana Galvan-Sosa, Gabrielle Gaudeau, Pride Kavumba, Yunmeng Li, Hongyi gu, Zheng Yuan, Keisuke Sakaguchi, Paula Buttery
研究方向: 自然语言处理与人工智能
该研究旨在通过设计一个评估框架来评估大型语言模型(LLMs)生成解释的质量,并提出一个名为 Rubrik 的评估工具。Rubrik 的设计基于教育原则,结合了来自教育、可解释人工智能(XAI)和自然语言生成(NLG)领域的见解。