Did ChatGPT or Copilot use alter the style of internet news headlines? A time series regression analysis

作者: Chris Brogly, Connor McElroy

发布时间: 2025-04-03

来源: arxiv

研究方向: 人工智能与自然语言处理

主要内容

本研究旨在探讨大型语言模型(LLMs)如ChatGPT和Copilot的发布是否对互联网新闻标题的写作风格产生了影响。通过分析451百万条新闻标题和链接的175个NLP特征,研究使用中断时间序列分析来评估LLMs发布后是否出现了统计上显著的持续变化。

主要贡献

1. 首次对LLMs发布对新闻标题写作风格的影响进行了大规模中断时间序列分析。

2. 确定了13个在ChatGPT和/或Copilot发布后出现显著持续变化的NLP特征。

3. 使用控制模型(如GPT-3和Gopher)来验证LLMs发布对新闻标题风格的影响。

4. 发现LLMs对新闻标题风格的影响有限,仅在某些NLP度量方面有所体现。

研究方法

1. 中断时间序列分析

2. NLP特征提取(包括通用POS标签、宾州树库POS标签、依赖标签和命名实体识别标签)

3. 普通最小二乘法(OLS)回归模型

4. 控制模型的使用

实验结果

研究发现,大多数NLP特征在ChatGPT和/或Copilot发布后没有出现显著的持续变化。13个特征在LLMs发布后显示出显著的变化,而在使用GPT-3和Gopher作为控制模型时没有显示出这种变化。这表明LLMs可能只在某些方面对新闻标题风格产生了有限的影响。

未来工作

未来的研究可以包括使用更先进的统计模型,分析更长的文本(如段落),或者研究LLMs在新闻内容生成中的更广泛影响。