Ticktack : Long Span Temporal Alignment of Large Language Models Leveraging Sexagenary Cycle Time Expression

作者: Xue Han, Qian Hu, Yitong Wang, Wenchun Gao, Lianlian Zhang, Qing Wang, Lijun Mei, Chao Deng, Junlan Feng

发布时间: 2025-03-07

来源: arxiv

研究方向: 自然语言处理（NLP）与长期时间信息处理

主要内容

本文提出了一种名为“Ticktack”的方法，旨在解决大型语言模型（LLMs）在处理长期时间信息时的时空错位问题。该方法通过利用干支年表达和极坐标建模来改善LLMs在长期时间尺度上的时间知识学习。

1. 提出了干支年表达，用于替代LLMs中使用的公历表达，以实现更均匀的时间粒度分布。

2. 使用极坐标对干支周期和每个周期内的年份顺序进行建模，并结合额外的时序编码，以确保LLMs能够理解。

3. 提出了一个时序表征对齐方法，用于在LLMs进行后训练时区分具有相关知识的时点，从而提高时间相关任务的表现，尤其是在长期时间尺度上。

4. 创建了TempLS数据集，用于评估Ticktack方法的有效性。

1. 干支年表达与公历年表达之间的转换

2. 极坐标表示法

3. 时序编码

4. 时序对齐目标函数

5. 弹性权重巩固（EWC）理论

实验结果表明，与仅进行后训练的模型相比，使用Ticktack进行后训练的模型在时间相关任务上表现出显著改进。在TempLS数据集上的实验显示，Ticktack方法可以显著提高LLMs在处理长期时间信息时的性能。

探索使用干支周期来表示时间粒度的更多细节，例如月份和日期。开发更多样化的长期时间信息基准，以增强时间信息理解评估的全面性和可靠性。