Interpretable Text Embeddings and Text Similarity Explanation: A Primer

作者: Juri Opitz, Lucas Möller, Andrianos Michail, Simon Clematide

发布时间: 2025-02-23 22:28:43

来源: arxiv

研究方向: 可解释文本嵌入和文本相似度解释

主要内容

本文旨在提供对基于嵌入的相似度模型和度量的理解,特别是针对解释相似度得分的研究。文章涵盖了不同类型的可解释性方法,包括空间塑造、基于集合和基于归因的方法,并讨论了它们的潜在优势和挑战。

主要贡献

1. 提供了一个关于可解释文本嵌入和相似度解释方法的系统概述。

2. 区分了不同类型的可解释性方法,包括空间塑造、基于集合和基于归因的方法。

3. 讨论了这些方法的潜在优势和挑战,并提供了实验结果。

4. 提出了一个关于可解释性方法的分类框架,包括类型、子类型、训练、近似性和推理成本等特征。

研究方法

1. 空间塑造方法,如特征分解、非欧几里得几何和组合嵌入。

2. 基于集合的方法,如嵌入集可解释性和显式多解释。

3. 基于归因的方法,如集成梯度和层相关传播。

4. 相关数据集,如iSTS、CSTS和STS3k,用于评估和生成解释。

实验结果

文章没有提供具体的实验结果,但讨论了不同方法在可解释性和性能方面的潜在优势。

未来工作

未来工作可能包括更深入的比较不同解释方法的性能和可解释性,以及开发新的方法来解释长文档的相似度。此外,研究可能还会探索跨语言文本语义现象的解释,以及测试关于通用语义的假设。