Ticktack : Long Span Temporal Alignment of Large Language Models Leveraging Sexagenary Cycle Time Expression
作者: Xue Han, Qian Hu, Yitong Wang, Wenchun Gao, Lianlian Zhang, Qing Wang, Lijun Mei, Chao Deng, Junlan Feng
发布时间: 2025-03-10
来源: arxiv
研究方向: 自然语言处理,尤其是大型语言模型在处理长期时间信息时的时序对齐问题
主要内容
提出了一种名为“Ticktack”的方法,用于解决大型语言模型(LLM)在处理长期时间信息时的时序对齐问题。该方法通过使用六十甲子年表达方式代替格里历表达方式,使用极坐标建模六十甲子周期和每个周期中的年份顺序,并通过额外的时序编码确保LLM能够理解这些信息,从而提高LLM在时间相关任务上的性能,尤其是在处理长期时间信息时。
主要贡献
1. 提出了一种基于六十甲子年表达方式的时序对齐方法,有效解决了LLM在处理长期时间信息时的时序对齐问题。
2. 通过使用极坐标和额外的时序编码,增强了LLM对时间信息的理解能力。
3. 创建了一个长期时间跨度基准数据集TempLS,用于评估LLM在处理长期时间信息时的性能。
研究方法
1. 六十甲子年表达方式
2. 极坐标建模
3. 额外的时序编码
4. 时序对齐方法
5. EWC理论
6. 相似度算法
实验结果
在TempLAMA、TempUN和TempLS三个时间问答数据集上进行的实验结果表明,使用Ticktack训练的LLM在时间相关任务上的性能显著优于基线模型和仅进行后训练的模型。此外,在低资源年份(如BCE时期)上,Ticktack也表现出显著的性能提升。可视化结果表明,Ticktack能够有效地将时间信息编码到LLM的嵌入中,从而提高LLM对时间信息的敏感性。
未来工作
未来将探索使用六十甲子周期来表示更多时间粒度,如月份和日期。此外,将开发新的长期时间相关基准数据集,以进一步提高LLM对时间信息理解的评估方法和可靠性。