Robust Conformal Prediction with a Single Binary Certificate

作者: Soroush H. Zargarbashi, Aleksandar Bojchevski

研究方向: 机器学习与不确定量化

本文研究了基于随机平滑的鲁棒一致预测方法,旨在提高模型在噪声或对抗性扰动下的可靠性。该方法通过将平滑分数分布二值化,并使用阈值来保持覆盖保证,从而生成小型预测集。

ID: 2503.05239v1来源: arxiv发布时间: 2025-03-10

Kaiwu: A Multimodal Manipulation Dataset and Framework for Robot Learning and Human-Robot Interaction

作者: Shuo Jiang, Haonan Li, Ruochen Ren, Yanmin Zhou, Zhipeng Wang, Bin He

研究方向: 机器人学习、机器人感知、人机交互、多模态融合

本文介绍了Kaiwu数据集及其构建框架,旨在解决复杂组装场景中缺失的实时同步多模态数据问题,尤其是动态信息和细粒度标注。数据集提供了一个整合人、环境和机器人数据收集框架,包含20位参与者和30个交互对象,产生总共11,664个整合动作实例。每个演示中记录了手部动作、操作压力、组装过程的声音、多视图视频、高精度运动捕捉信息、第一人称视频中的注视点和肌电图信号。数据集旨在促进机器人学习、灵巧操作、人类意图调查和人机协作研究。

ID: 2503.05231v1来源: arxiv发布时间: 2025-03-10

Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving

作者: Kalle Kujanpää, Daulet Baimukashev, Farzeen Munir, Shoaib Azam, Tomasz Piotr Kucner, Joni Pajarinen, Ville Kyrki

研究方向: 自动驾驶与行为建模

本文提出了一种名为DSDP(离散风格扩散策略)的框架,用于从现有数据集中学习人类驾驶行为。该框架利用对比学习提取驾驶风格字典,并通过量化离散化这些风格,用于学习条件扩散策略以模拟人类驾驶员的行为。

ID: 2503.05229v1来源: arxiv发布时间: 2025-03-10

MOHPER: Multi-objective Hyperparameter Optimization Framework for E-commerce Retrieval System

作者: Jungbae Park, Heonseok Jang

研究方向: 电子商务搜索优化与多目标超参数优化

本文提出了MOHPER,一个针对电子商务检索系统的多目标超参数优化框架。该框架利用贝叶斯优化和采样技术,联合优化点击率(CTR)、点击转化率(CTCVR)和其它相关目标,旨在平衡用户体验和收入目标。

ID: 2503.05227v1来源: arxiv发布时间: 2025-03-10

Reward-Centered ReST-MCTS: A Robust Decision-Making Framework for Robotic Manipulation in High Uncertainty Environments

作者: Xibai Wang

研究方向: 机器人操作和决策制定

本文提出了一种名为Reward-Centered ReST-MCTS的决策制定框架,旨在提高在高度不确定性环境中进行机器人操作的能力。该框架通过结合蒙特卡洛树搜索(MCTS)和中间奖励塑造,实现更有效的搜索和决策。

ID: 2503.05226v1来源: arxiv发布时间: 2025-03-10

Deep Sequence Models for Predicting Average Shear Wave Velocity from Strong Motion Records

作者: Baris Yilmaz, Erdem Akagündüz, Salih Tileylioglu

研究方向: 地震工程与深学习

该研究旨在利用深度学习技术,特别是结合卷积神经网络(CNN)和长短期记忆网络(LSTM)的混合模型,预测地震记录中的平均剪切波速度(Vs30)。Vs30是地震工程中用于场地特征化和地震风险评估的关键参数。

ID: 2503.05224v1来源: arxiv发布时间: 2025-03-10

Knowledge Updating? No More Model Editing! Just Selective Contextual Reasoning

作者: Guoxiu He, Xin Song, Aixin Sun

研究方向: 人工智能,自然语言处理,大语言模型知识更新

本文研究了大语言模型(LLM)的知识更新问题,提出了一种名为选择性情境推理(SCR)的方法,用于在不修改模型参数的情况下更新LLM的知识。

ID: 2503.05212v1来源: arxiv发布时间: 2025-03-10

Policy Constraint by Only Support Constraint for Offline Reinforcement Learning

作者: Yunkai Gao, Jiaming Guo, Fan Wu, Rui Zhang

研究方向: 离线强化学习(Offline Reinforcement Learning)

本文提出了一种名为Only Support Constraint(OSC)的方法,用于解决离线强化学习中由于学习策略和行为策略之间的分布差异导致的分布偏移问题。OSC通过最大化学习策略在行为策略支持集中的总概率来约束学习策略,从而减轻了现有策略约束方法的保守性。

ID: 2503.05207v1来源: arxiv发布时间: 2025-03-10

Path Pooling: Train-Free Structure Enhancement for Efficient Knowledge Graph Retrieval-Augmented Generation

作者: Hairu Wang, Yuan Feng, Xike Xie, S Kevin Zhou

研究方向: 知识图谱增强的生成式模型(KG-RAG)

本文针对大型语言模型(LLM)在现实应用中存在的幻觉和知识缺陷问题,提出了一种名为路径池化的训练自由结构增强策略,用于提升知识图谱检索增强生成(KG-RAG)的性能。

ID: 2503.05203v1来源: arxiv发布时间: 2025-03-10

Deep Muscle EMG construction using A Physics-Integrated Deep Learning approach

作者: Rajnish Kumar, Tapas Tripura, Souvik Chakraborty, Sitikantha Roy

研究方向: 生物力学与机器学习

该研究提出了一种名为NMM(神经肌肉骨骼模型)的混合深度学习算法,用于从深层肌肉的关节运动学数据中近似构建深层肌肉的EMG(肌电图)信号。该算法结合了物理信息与数据驱动深度学习,通过将物理定律嵌入到机器学习模型中,有效地学习高维肌肉骨骼系统的复杂特征。

ID: 2503.05201v1来源: arxiv发布时间: 2025-03-10