Ticktack : Long Span Temporal Alignment of Large Language Models Leveraging Sexagenary Cycle Time Expression

作者: Xue Han, Qian Hu, Yitong Wang, Wenchun Gao, Lianlian Zhang, Qing Wang, Lijun Mei, Chao Deng, Junlan Feng

发布时间: 2025-03-07

来源: arxiv

研究方向: 自然语言处理(NLP)与长期时间信息处理

主要内容

本文提出了一种名为“Ticktack”的方法,旨在解决大型语言模型(LLMs)在处理长期时间信息时的时空错位问题。该方法通过利用干支年表达和极坐标建模来改善LLMs在长期时间尺度上的时间知识学习。

主要贡献

1. 提出了干支年表达,用于替代LLMs中使用的公历表达,以实现更均匀的时间粒度分布。

2. 使用极坐标对干支周期和每个周期内的年份顺序进行建模,并结合额外的时序编码,以确保LLMs能够理解。

3. 提出了一个时序表征对齐方法,用于在LLMs进行后训练时区分具有相关知识的时点,从而提高时间相关任务的表现,尤其是在长期时间尺度上。

4. 创建了TempLS数据集,用于评估Ticktack方法的有效性。

研究方法

1. 干支年表达与公历年表达之间的转换

2. 极坐标表示法

3. 时序编码

4. 时序对齐目标函数

5. 弹性权重巩固(EWC)理论

实验结果

实验结果表明,与仅进行后训练的模型相比,使用Ticktack进行后训练的模型在时间相关任务上表现出显著改进。在TempLS数据集上的实验显示,Ticktack方法可以显著提高LLMs在处理长期时间信息时的性能。

未来工作

探索使用干支周期来表示时间粒度的更多细节,例如月份和日期。开发更多样化的长期时间信息基准,以增强时间信息理解评估的全面性和可靠性。