EuroBERT: Scaling Multilingual Encoders for European Languages
作者: Nicolas Boizard, Hippolyte Gisserot-Boukhlef, Duarte M. Alves, André Martins, Ayoub Hammal, Caio Corro, Céline Hudelot, Emmanuel Malherbe, Etienne Malaboeuf, Fanny Jourdan, Gabriel Hautreux, João Alves, Kevin El-Haddad, Manuel Faysse, Maxime Peyrard, Nuno M. Guerreiro, Patrick Fernandes, Ricardo Rei, Pierre Colombo
研究方向: 自然语言处理 (NLP) 与多语言编码器
该研究提出了 EuroBERT,一种针对欧洲语言和广泛使用的全球语言的多语言编码器家族。EuroBERT 通过结合最新的架构改进和大规模多语言数据集,在检索、回归和分类等任务中取得了优异的性能。
ID: 2503.05500v1•来源: arxiv•发布时间: 2025-03-10