Less or More: Towards Glanceable Explanations for LLM Recommendations Using Ultra-Small Devices

作者: Xinru Wang, Mengjie Yu, Hannah Nguyen, Michael Iuzzolino, Tianyi Wang, Peiqi Tang, Natasha Lynova, Co Tran, Ting Zhang, Naveen Sendhilnathan, Hrvoje Benko, Haijun Xia, Tanya Jonker

研究方向: 面向超小型设备的可解释AI(XAI)与大型语言模型(LLM)推荐系统的可读性研究

本研究探讨了如何在超小型设备(如智能手表)上提供简洁且易于理解的LLM推荐解释。研究通过结构化解释文本和基于置信度的自适应展示策略,优化了用户在有限屏幕空间下的交互体验。研究提出了两种主要方法:1)通过定义上下文组件在提示过程中结构化LLM的解释文本;2)根据置信度水平自适应地向用户展示解释。研究通过用户实验验证了这些方法对用户体验的影响。

ID: 2502.19410v1来源: arxiv发布时间: 2025-02-27

TheoremExplainAgent: Towards Multimodal Explanations for LLM Theorem Understanding

作者: Max Ku, Thomas Chong, Jonathan Leung, Krish Shah, Alvin Yu, Wenhu Chen

研究方向: 多模态定理解释与AI生成教育视频

本文提出了TheoremExplainAgent,一个基于LLM的多模态定理解释生成系统,旨在通过生成长视频来解释复杂的STEM定理。系统结合了文本、视觉和音频元素,使用Manim库生成动画视频,并通过TheoremExplainBench基准数据集进行评估。研究揭示了AI在生成长视频方面的潜力,同时也指出了视觉布局和推理错误暴露的挑战。

ID: 2502.19400v1来源: arxiv发布时间: 2025-02-27

Multi-modal Contrastive Learning for Tumor-specific Missing Modality Synthesis

作者: Minjoo Lim, Bogyeong Kang, Tae-Eui Kam

研究方向: 多模态MRI图像合成与脑肿瘤分割

本文提出了一种基于多模态对比学习的生成模型,用于从可用的多模态MRI图像中合成缺失的目标模态图像。该模型通过结合多模态对比学习和分割解码器,提高了生成图像的质量,特别是在肿瘤区域的生成精度。模型在BraSyn挑战中表现出色,能够生成高质量的缺失模态图像,并同时预测分割输出。

ID: 2502.19390v1来源: arxiv发布时间: 2025-02-27

Efficient 4D fMRI ASD Classification using Spatial-Temporal-Omics-based Learning Framework

作者: Ziqiao Weng, Weidong Cai, Bo Zhou

研究方向: 基于fMRI数据的自闭症谱系障碍(ASD)分类研究

本文提出了一种新的空间-时间-组学学习框架(STO),用于从fMRI数据中高效提取空间和时间特征,以进行ASD分类。该框架结合了空间-时间体素组学(STVOmics)和空间-时间区域组学(STROmics),分别从体素和区域层面提取特征,并通过3D CNN和单层感知器(SLP)进行处理,最终融合特征进行分类。

ID: 2502.19386v1来源: arxiv发布时间: 2025-02-27

Preference-Based Gradient Estimation for ML-Based Approximate Combinatorial Optimization

作者: Arman Mielke, Uwe Bauknecht, Thilo Strauss, Mathias Niepert

研究方向: 组合优化(Combinatorial Optimization, CO)与机器学习结合的研究,特别是基于图神经网络(GNN)的近似算法改进。

本文提出了一种数据驱动的方法,通过参数化现有的非学习型近似算法,并使用图神经网络(GNN)预测参数值,以改进组合优化问题的求解质量。该方法通过自监督的方式进行端到端训练,并引入了一种新的梯度估计方案——基于偏好的梯度估计(Preference-Based Gradient Estimation, PBGE)。该方法结合了GNN和传统近似算法的优势,能够在保证解可行性的同时,利用数据集中的信息找到更好的解。

ID: 2502.19377v1来源: arxiv发布时间: 2025-02-27

DataMan: Data Manager for Pre-training Large Language Models

作者: Ru Peng, Kexin Yang, Yawen Zeng, Junyang Lin, Dayiheng Liu, Junbo Zhao

研究方向: 大规模语言模型(LLM)预训练数据管理

本文研究了如何选择预训练数据以提升大规模语言模型(LLM)的性能。作者提出了DataMan,一个能够进行质量评分和领域识别的数据管理器,通过数据采样策略优化LLM预训练。

ID: 2502.19363v1来源: arxiv发布时间: 2025-02-27

Physics-Based Hybrid Machine Learning for Critical Heat Flux Prediction with Uncertainty Quantification

作者: Aidan Furlong, Xingang Zhao, Robert Salko, Xu Wu

研究方向: 核工程与安全、机器学习、不确定性量化

该研究提出了一种基于物理模型和机器学习的混合建模方法,用于预测核反应堆中的临界热流量(CHF),特别是在干涸情况下的CHF预测。研究结合了经验相关和机器学习技术,旨在提高CHF预测的准确性和可解释性。

ID: 2502.19357v1来源: arxiv发布时间: 2025-02-27

Deep Learning-Based Transfer Learning for Classification of Cassava Disease

作者: Ademir G. Costa Junior, Fábio S. da Silva, Ricardo Rios

研究方向: 农业病害检测与分类

该研究对比了四种卷积神经网络架构(EfficientNet-B3、InceptionV3、ResNet50和VGG16)在分类木薯病害图像方面的性能。研究人员使用了一个不平衡的数据集,并采用了适当的指标来解决类别不平衡问题。

ID: 2502.19351v1来源: arxiv发布时间: 2025-02-27

Controlled Diversity: Length-optimized Natural Language Generation

作者: Diana Marie Schenke, Timo Baumann

研究方向: 自然语言生成与机器学习

该研究提出了一种方法,通过增强数据和现有微调技术训练大型语言模型(LLM),使其能够根据严格长度要求生成文本。该方法旨在提高LLM在需要遵循多样化用户和系统要求的应用中的实用性。

ID: 2502.19347v1来源: arxiv发布时间: 2025-02-27

Joint Optimal Transport and Embedding for Network Alignment

作者: Qi Yu, Zhichen Zeng, Yuchen Yan, Lei Ying, R. Srikant, Hanghang Tong

研究方向: 网络对齐和网络嵌入

本文提出了一种名为JOENA的联合最优传输和嵌入框架,用于网络对齐。该框架结合了基于嵌入的方法和基于最优传输(OT)的方法,以实现节点嵌入和节点对齐的联合学习。

ID: 2502.19334v1来源: arxiv发布时间: 2025-02-27