Crossing Boundaries: Leveraging Semantic Divergences to Explore Cultural Novelty in Cooking Recipes
作者: Florian Carichon, Romain Rampa, Golnoosh Farnadi
发布时间: 2025-04-03
来源: arxiv
研究方向: 自然语言处理(NLP)与文化多样性
主要内容
本研究旨在通过分析烹饪食谱中的文化差异来探索文化新颖性。研究者提出了一种跨学科框架,结合了社会学和管理学的知识,并创建了一个名为GlobalFusion的数据集,包含来自150多个国家的500道菜和约10万个烹饪食谱。通过引入Jensen-Shannon散度指标来衡量新颖性,研究者分析了不同文化背景之间修改食谱时的文本差异。
主要贡献
1. 提出了五种信息论文化新颖性指标,用于测量文本数据中的各种差异现象。
2. 引入了GlobalFusion数据集,该数据集便于比较不同文化中相同文化产品的文本描述。
3. 将所提出的指标与四种文化距离(英格尔哈特-韦尔茨文化距离、地理距离、语言距离和宗教距离)进行了评估,这些距离来自社会科学。
4. 提出了一个新框架来评估文本生产中的文化距离,重点关注人类如何适应自己的文化来调整文化产品。
5. 结果表明,新颖性散度指标与文化距离显著相关,并且相关性的强度取决于所研究的文化方面。
研究方法
1. Jensen-Shannon散度(JSD)
2. 文化知识空间构建
3. 新颖性检测:新性、独特性、差异和惊喜
4. GlobalFusion数据集分析
5. 文化距离度量:英格尔哈特-韦尔茨文化地图、语言距离、宗教距离和地理距离
6. 普通最小二乘回归(OLS)
实验结果
实验结果表明,所提出的文化新颖性指标与不同文化距离指标之间存在显著相关性。此外,不同新颖性指标之间存在不同的相关性,表明它们可以测量新颖性的不同方面。
未来工作
未来工作将扩展到其他文化产品,例如电影摘要或文学作品,并考虑使用不同语言的数据库。此外,研究将探索替代的散度表示,例如多原型和概念性语言表示,以及基于熵排名的方法,以捕捉文化新颖性的新维度。