BeMERC: Behavior-Aware MLLM-based Framework for Multimodal Emotion Recognition in Conversation

作者: Yumeng Fu, Junjie Wu, Zhongjie Wang, Meishan Zhang, Yulin Wu, Bingquan Liu

研究方向: 多模态情感识别(MERC)

本文提出了一种名为BeMERC的行为感知多模态情感识别框架,旨在通过融合视频中的行为信息(如面部表情、身体语言和姿态)来提高对话中情感识别的准确性。

ID: 2503.23990v1来源: arxiv发布时间: 2025-04-03

Rubric Is All You Need: Enhancing LLM-based Code Evaluation With Question-Specific Rubrics

作者: Aditya Pathak, Rachit Gandhi, Vaibhav Uttam, Devansh, Yashwanth Nakka, Aaryan Raj Jindal, Pratyush Ghosh, Arnav Ramamoorthy, Shreyash Verma, Aditya Mittal, Aashna Ased, Chirag Khatri, Jagat Sesh Challa, Dhruv Kumar

研究方向: 自然语言处理在编程教育中的应用

该研究聚焦于利用大型语言模型(LLM)进行代码评估,并提出了一种基于问题特定评分标准的方法,旨在提高代码评估的准确性和效率。

ID: 2503.23989v1来源: arxiv发布时间: 2025-04-02

Deep Learning Model Deployment in Multiple Cloud Providers: an Exploratory Study Using Low Computing Power Environments

作者: Elayne Lemos, Rodrigo Oliveira, Jairson Rodrigues, Rosalvo F. Oliveira Neto

研究方向: 云计算与深度学习

本研究探讨了在低资源环境下,使用云服务部署深度学习模型(以GECToR模型为例)的可行性和成本效益。通过在AWS、Google Cloud和Azure三个主要云平台上的不同硬件配置下进行实验,评估了实时延迟、硬件使用率和成本。

ID: 2503.23988v1来源: arxiv发布时间: 2025-04-02

Deep Nets as Hamiltonians

作者: Mike Winer, Boris Hanin

研究方向: 深度学习理论与统计物理

本文研究将随机初始化的多层感知器(MLP)视为其输入的哈密顿量,并分析由该哈密顿量引起的能量景观的性质,重点关注无限宽度极限下近全局最小结构。作者使用副本技巧进行精确的解析计算,给出了给定能量的熵(空间体积的对数)。此外,他们还推导了鞍点方程,描述了从由随机MLP引起的吉布斯分布中独立同分布采样的输入之间的重叠。对于线性激活,他们精确地解决了这些鞍点方程,并数值地解决了各种深度和激活函数(包括tanh、sin、ReLU和形状非线性)的鞍点方程。他们发现即使在无限宽度下,也存在丰富的行为。

ID: 2503.23982v1来源: arxiv发布时间: 2025-04-02

Noise-based reward-modulated learning

作者: Jesús García Fernández, Nasir Ahmad, Marcel van Gerven

研究方向: 强化学习与神经可塑性

提出了一种基于噪声的奖励调制学习(NRL)方法,旨在解决强化学习中传统方法在资源受限环境或使用非可微神经网络时的局限性。该方法结合了方向导数理论和类似Hebbian的更新,以实现强化学习中的高效、无梯度学习。

ID: 2503.23972v1来源: arxiv发布时间: 2025-04-02

Machine Learning-assisted High-speed Combinatorial Optimization with Ising Machines for Dynamically Changing Problems

作者: Yohei Hamakawa, Tomoya Kashimata, Masaya Yamasaki, Kosuke Tatsumura

研究方向: 量子计算与机器学习辅助的高速组合优化

本文研究了利用嵌入式的Ising机器解决动态变化问题的组合优化方法,通过压缩Ising模型和加速计算,结合机器学习模型估计参数,实现高速、无需运行时参数调整的组合优化。

ID: 2503.23966v1来源: arxiv发布时间: 2025-04-02

Video-based Traffic Light Recognition by Rockchip RV1126 for Autonomous Driving

作者: Miao Fan, Xuxu Kong, Shengtong Xu, Haoyi Xiong, Xiangzeng Liu

研究方向: 自动驾驶领域中的交通信号灯识别

本文提出了一种基于视频的端到端神经网络ViTLR,用于自动驾驶环境中的交通信号灯识别。ViTLR能够处理连续的多个帧,以实现鲁棒的交通信号灯检测和状态分类。

ID: 2503.23965v1来源: arxiv发布时间: 2025-04-03

HeteroPod: XPU-Accelerated Infrastructure Offloading for Commodity Cloud-Native Applications

作者: Bicheng Yang, Jingkai He, Dong Du, Yubin Xia, Haibo Chen

研究方向: 云计算,异构计算,云原生应用

本文提出了一种名为HeteroPod的新架构,旨在通过将基础设施服务卸载到数据处理单元(DPUs)上来提高商品云原生应用的性能和可扩展性。该架构通过引入HeteroNet网络系统,实现了跨PU(XPU)的透明、高效和资源高效的网络通信。

ID: 2503.23952v1来源: arxiv发布时间: 2025-04-02

Model Hemorrhage and the Robustness Limits of Large Language Models

作者: Ziyang Ma, Zuchao Li, Lefei Zhang, Gui-Song Xia, Bo Du, Liangpei Zhang, Dacheng Tao

研究方向: 大型语言模型(LLM)的鲁棒性和性能优化

本文研究了大型语言模型在部署过程中由于参数调整和架构修改导致的性能下降现象,称为“模型出血”。通过分析不同操作和修改方式对模型性能的影响,提出了减轻这些问题的策略,旨在提高LLM在各种应用环境中的稳定性、可靠性和可扩展性。

ID: 2503.23924v1来源: arxiv发布时间: 2025-04-03

Entropy-Based Adaptive Weighting for Self-Training

作者: Xiaoxuan Wang, Yihe Deng, Mingyu Derek Ma, Wei Wang

研究方向: 大型语言模型(LLM)的数学推理能力与自训练方法

本文提出了一种名为EAST的自训练方法,旨在通过自适应加权策略来优化模型训练,提高LLM在数学推理任务中的能力。EAST通过考虑模型的不确定性,为自训练过程中的数据分配不同的权重,从而引导模型关注更具信息量和挑战性的示例。

ID: 2503.23913v1来源: arxiv发布时间: 2025-04-03