Interpretable Transformation and Analysis of Timelines through Learning via Surprisability

作者: Osnat Mokryn, Teddy Lazebnik, Hagit Ben Shoshan

发布时间: 2025-03-08

来源: arxiv

研究方向: 时间序列数据分析与异常检测

主要内容

本文提出了一种名为“通过惊讶度学习”(Learning via Surprisability, LvS)的新方法,用于转换和分析高维时间序列数据。LvS通过量化并优先处理时间序列数据中的异常值,将认知科学中的惊讶度概念与计算方法相结合,从而在保留关键上下文的同时检测异常和变化,为复杂数据集提供新的解释视角。

主要贡献

1. 提出了一种新的时间序列数据转换方法——通过惊讶度学习(LvS),该方法能够有效地识别异常值、异常点和时间序列中的最可变特征。

2. 将认知科学中的惊讶度概念与计算方法相结合,为复杂数据集提供新的解释视角。

3. 在三个高维时间序列数据集上展示了LvS方法的有效性,包括传感器数据、全球死亡原因数据和美国总统的国情咨文文本数据集。

研究方法

1. 通过惊讶度学习(LvS)

2. Jensen-Shannon (JS) 散度

3. Kullback-Leibler (KL) 散度

4. 时间线中心表示(TCR)

5. 时间序列的惊讶度配置文件(SP)

实验结果

在SWaT数据集上,LvS在异常检测方面与最先进的无监督算法相比表现良好。在分析全球死亡原因数据时,LvS能够识别出特定年份的异常情况,例如1994年的冲突、2004年的自然灾害等。在分析美国总统的国情咨文文本数据时,LvS能够捕捉到不同总统的写作风格和主题选择,以及随着时间的推移出现的语言和主题变化。

未来工作

未来工作将包括在更多专业领域应用LvS,例如生物医学信号处理或金融交易中的欺诈检测。此外,将研究解决LvS当前限制的方法,例如自适应阈值、实时处理和领域特定优化,以进一步扩展其适用性并将LvS确立为复杂时间序列数据分析的标准方法。