Interpretable Text Embeddings and Text Similarity Explanation: A Primer

作者: Juri Opitz, Lucas Möller, Andrianos Michail, Simon Clematide

发布时间: 2025-02-23 22:28:43

来源: arxiv

研究方向: 可解释文本嵌入和文本相似度解释

主要内容

本文旨在提供对基于嵌入的相似度模型和度量的理解，特别是针对解释相似度得分的研究。文章涵盖了不同类型的可解释性方法，包括空间塑造、基于集合和基于归因的方法，并讨论了它们的潜在优势和挑战。

1. 提供了一个关于可解释文本嵌入和相似度解释方法的系统概述。

2. 区分了不同类型的可解释性方法，包括空间塑造、基于集合和基于归因的方法。

3. 讨论了这些方法的潜在优势和挑战，并提供了实验结果。

4. 提出了一个关于可解释性方法的分类框架，包括类型、子类型、训练、近似性和推理成本等特征。

1. 空间塑造方法，如特征分解、非欧几里得几何和组合嵌入。

2. 基于集合的方法，如嵌入集可解释性和显式多解释。

3. 基于归因的方法，如集成梯度和层相关传播。

4. 相关数据集，如iSTS、CSTS和STS3k，用于评估和生成解释。

文章没有提供具体的实验结果，但讨论了不同方法在可解释性和性能方面的潜在优势。

未来工作可能包括更深入的比较不同解释方法的性能和可解释性，以及开发新的方法来解释长文档的相似度。此外，研究可能还会探索跨语言文本语义现象的解释，以及测试关于通用语义的假设。