Interpretable Text Embeddings and Text Similarity Explanation: A Primer
作者: Juri Opitz, Lucas Möller, Andrianos Michail, Simon Clematide
发布时间: 2025-02-23 22:28:43
来源: arxiv
研究方向: 可解释文本嵌入和文本相似度解释
主要内容
本文旨在提供对基于嵌入的相似度模型和度量的理解,特别是针对解释相似度得分的研究。文章涵盖了不同类型的可解释性方法,包括空间塑造、基于集合和基于归因的方法,并讨论了它们的潜在优势和挑战。
主要贡献
1. 提供了一个关于可解释文本嵌入和相似度解释方法的系统概述。
2. 区分了不同类型的可解释性方法,包括空间塑造、基于集合和基于归因的方法。
3. 讨论了这些方法的潜在优势和挑战,并提供了实验结果。
4. 提出了一个关于可解释性方法的分类框架,包括类型、子类型、训练、近似性和推理成本等特征。
研究方法
1. 空间塑造方法,如特征分解、非欧几里得几何和组合嵌入。
2. 基于集合的方法,如嵌入集可解释性和显式多解释。
3. 基于归因的方法,如集成梯度和层相关传播。
4. 相关数据集,如iSTS、CSTS和STS3k,用于评估和生成解释。
实验结果
文章没有提供具体的实验结果,但讨论了不同方法在可解释性和性能方面的潜在优势。
未来工作
未来工作可能包括更深入的比较不同解释方法的性能和可解释性,以及开发新的方法来解释长文档的相似度。此外,研究可能还会探索跨语言文本语义现象的解释,以及测试关于通用语义的假设。