Supporting the development of Machine Learning for fundamental science in a federated Cloud with the AI_INFN platform

作者: Lucio Anderlini, Matteo Barbetti, Giulio Bianchini, Diego Ciangottini, Stefano Dal Pra, Diego Michelotto, Carmelo Pellegrino, Rosa Petrini, Alessandro Pascolini, Daniele Spiga

研究方向: 机器学习在基础科学中的应用,特别是在高能物理领域

该论文介绍了INFN(意大利国家核物理研究所)的AI_INFN项目,旨在通过提供专门针对人工智能的云计算资源,促进机器学习技术在基础科学领域的应用。该项目构建了一个名为AI_INFN的平台,用于支持机器学习研究人员的计算需求。

ID: 2502.21266v1来源: arxiv发布时间: 2025-03-03

RuCCoD: Towards Automated ICD Coding in Russian

作者: Aleksandr Nesterov, Andrey Sakhovskiy, Ivan Sviridov, Airat Valiev, Vladimir Makharev, Petr Anokhin, Galina Zubkova, Elena Tutubalina

研究方向: 医疗信息处理与自然语言处理

该研究旨在自动化俄罗斯语临床编码,以解决俄罗斯语在生物医学资源有限的情况下进行临床编码的可行性问题。研究者提出了一个新的数据集,用于ICD编码,包含来自电子健康记录的诊断字段,并标注了超过10,000个实体和1,500多个独特的ICD代码。研究者还应用了最佳模型来标注内部EHR数据集,并进行了实验,结果表明,与医生手动标注的数据相比,使用自动预测的代码进行训练可以显著提高准确性。

ID: 2502.21263v1来源: arxiv发布时间: 2025-03-03

Modeling Human Beliefs about AI Behavior for Scalable Oversight

作者: Leon Lang, Patrick Forré

研究方向: 人工智能与人类价值观的建模与对齐

该论文研究了如何通过建模人类对AI行为的信念来监督AI系统,以实现可扩展的监督。论文提出了人类信念模型的概念,并通过理论分析证明了该模型在推断人类价值观方面的作用。此外,论文还提出了使用基础模型构建覆盖信念模型的方法,为可扩展监督提供了一种新的潜在途径。

ID: 2502.21262v1来源: arxiv发布时间: 2025-03-03

Towards Developing Ethical Reasoners: Integrating Probabilistic Reasoning and Decision-Making for Complex AI Systems

作者: Nijesh Upreti, Jessica Ciupa, Vaishak Belle

研究方向: 人工智能伦理与决策

该研究旨在构建一个综合性的计算伦理框架,用于开发能够处理复杂、真实世界环境中的道德决策的AI系统。该框架结合了概率推理、决策制定和知识表示,以支持在个体决策和多智能体系统集体动态中的道德推理。

ID: 2502.21250v1来源: arxiv发布时间: 2025-03-03

Transforming Tuberculosis Care: Optimizing Large Language Models For Enhanced Clinician-Patient Communication

作者: Daniil Filienko, Mahek Nizar, Javier Roberti, Denise Galdamez, Haroon Jakher, Sarah Iribarren, Weichao Yuwen, Martine De Cock

研究方向: 健康领域人工智能应用,特别是针对结核病的治疗和患者支持

该研究旨在开发一个基于大型语言模型(LLM)的结核病治疗支持工具,通过整合多种上下文学习技术,提高患者参与度和治疗效果。该工具旨在帮助医疗工作者更有效地与患者沟通,并提供个性化的治疗建议和情感支持。

ID: 2502.21236v1来源: arxiv发布时间: 2025-03-03

ByteScale: Efficient Scaling of LLM Training with a 2048K Context Length on More Than 12,000 GPUs

作者: Hao Ge, Junda Feng, Qi Huang, Fangcheng Fu, Xiaonan Nie, Lei Zuo, Haibin Lin, Bin Cui, Xin Liu

研究方向: 大规模语言模型(LLM)训练和优化

论文提出了一种名为ByteScale的LLM训练框架,旨在提高长序列和短序列混合训练的效率。该框架通过引入混合数据并行(HDP)策略,结合数据感知分片、动态通信和选择性卸载等优化方法,解决了现有训练框架中存在的冗余通信和不平衡计算问题。

ID: 2502.21231v1来源: arxiv发布时间: 2025-03-03

ECLeKTic: a Novel Challenge Set for Evaluation of Cross-Lingual Knowledge Transfer

作者: Omer Goldman, Uri Shaham, Dan Malkin, Sivan Eiger, Avinatan Hassidim, Yossi Matias, Joshua Maynez, Adi Mayrav Gilady, Jason Riesa, Shruti Rijhwani, Laura Rimell, Idan Szpektor, Reut Tsarfaty, Matan Eyal

研究方向: 自然语言处理,跨语言知识迁移

本文提出了一种名为ECLEKTIC的闭卷问答数据集,用于评估跨语言知识迁移能力。该数据集通过控制Wikipedia文章在不同语言中的存在与否,检测信息在不同语言中的不均匀覆盖。数据集中的问题在源语言中生成,答案则在相关Wikipedia文章中,这些文章在其他11种语言中没有对应的文章。实验结果表明,即使是SOTA模型也难以有效地在不同语言之间共享知识。

ID: 2502.21228v1来源: arxiv发布时间: 2025-03-03

XAIxArts Manifesto: Explainable AI for the Arts

作者: Nick Bryan-Kinns, Shuoyang Jasper Zheng, Francisco Castro, Makayla Lewis, Jia-Rey Chang, Gabriel Vigliensoni, Terence Broad, Michael Clemens, Elizabeth Wilson

研究方向: 人工智能与艺术领域的交互与融合,重点关注可解释人工智能(XAI)在艺术领域的应用。

论文介绍了XAIxArts宣言,旨在推动XAI在艺术领域的应用,强调透明性、伦理性以及艺术实践的价值。宣言提出了四个核心主题:1)赋权、包容和公平;2)重视艺术实践;3)黑客与故障;4)开放性。

ID: 2502.21220v1来源: arxiv发布时间: 2025-03-03

An Algebraic Framework for Hierarchical Probabilistic Abstraction

作者: Nijesh Upreti, Vaishak Belle

研究方向: 人工智能与机器学习,特别是认知AI、统计关系学习和神经符号AI领域

提出了一种基于代数框架的分层概率抽象方法,旨在解决复杂系统中概率模型抽象的挑战。该方法通过扩展分层抽象的测度理论基础,实现模块化问题解决,并支持详细层次分析和系统级理解。

ID: 2502.21216v1来源: arxiv发布时间: 2025-03-03

Transformers Learn to Implement Multi-step Gradient Descent with Chain of Thought

作者: Jianhao Huang, Zixuan Wang, Jason D. Lee

研究方向: 自然语言处理,机器学习,大型语言模型

该研究主要探讨了在大型语言模型中引入思维链(CoT)提示时的训练动态。通过在上下文权重预测任务中分析变压器的训练过程,研究了CoT在多步推理任务中的作用。

ID: 2502.21212v1来源: arxiv发布时间: 2025-03-03