Attenuation artifact detection and severity classification in intracoronary OCT using mixed image representations

作者: Pierandrea Cancian, Simone Saitta, Xiaojin Gu, Rudolf L. M. van Herten, Thijs J. Luttikholt, Jos Thannhauser, Rick H. J. A. Volleberg, Ruben G. A. van der Waerden, Joske L. van der Zande, Clarisa I. Sánchez, Bram van Ginneken, Niels van Royen, Ivana Išgum

研究方向: 心血管成像与深度学习

该研究提出了一种基于卷积神经网络(CNN)的方法,用于检测冠状动脉光学相干断层扫描(OCT)中的衰减伪影,并对其进行严重程度分类。通过结合笛卡尔坐标系和极坐标系下的图像特征,该方法提高了伪影检测的准确性。

ID: 2503.05322v1来源: arxiv发布时间: 2025-03-10

Disentangling Task Interference within Neurons: Model Merging in Alignment with Neuronal Mechanisms

作者: Zitao Fang, Guodong DU, Shuyang Yu, Yifei Guo, Yiwei Zhang, Jing Li, Ho-Kin Tang, Sim Kuan Goh

研究方向: 机器学习,模型融合,神经机制

本文研究了在模型融合过程中神经元对任务干扰的影响,提出了一种名为NeuroMerging的新框架,通过分解任务特定表示为两个互补的神经元子空间来减轻任务干扰,从而实现跨任务的无训练模型融合。

ID: 2503.05320v1来源: arxiv发布时间: 2025-03-10

Robust Multimodal Learning for Ophthalmic Disease Grading via Disentangled Representation

作者: Xinkun Wang, Yifang Wang, Senwei Liang, Feilong Tang, Chengzhi Liu, Ming Hu, Chao Hu, Junjun He, Zongyuan Ge, Imran Razzak

研究方向: 眼科学疾病分级的多模态学习与诊断

该研究针对眼科学疾病分级中多模态数据缺失的问题,提出了一种名为EDRL(Essence-Point and Disentangle Representation Learning)的框架,旨在提高诊断的准确性和鲁棒性。

ID: 2503.05319v1来源: arxiv发布时间: 2025-03-10

Uncertainty-Aware Decoding with Minimum Bayes Risk

作者: Nico Daheim, Clara Meister, Thomas Möllenhoff, Iryna Gurevych

研究方向: 自然语言处理,语言模型,不确定性量化

本文提出了一种基于最小贝叶斯风险(MBR)的解码方法,该方法考虑了模型参数的不确定性,以减少语言模型生成不可接受输出的概率,如事实错误的文本。作者通过将模型参数的后验分布纳入MBR的计算中,改进了MBR解码,使其成为一个原则上的不确定性感知解码方法。

ID: 2503.05318v1来源: arxiv发布时间: 2025-03-10

Adversarial Policy Optimization for Offline Preference-based Reinforcement Learning

作者: Hyungkyu Kang, Min-hwan Oh

研究方向: 强化学习(RL)与偏好强化学习(PbRL)

本文研究了离线偏好强化学习(PbRL),其中学习基于预先收集的偏好反馈对轨迹对。针对现有理论方法在不确定性下的保守性保证方面面临的挑战,提出了对抗性偏好策略优化(APPO),这是一种用于离线PbRL的计算效率高、保证样本复杂度界限的算法,无需依赖显式置信集。

ID: 2503.05306v1来源: arxiv发布时间: 2025-03-10

Frequency Autoregressive Image Generation with Continuous Tokens

作者: Hu Yu, Hao Luo, Hangjie Yuan, Yu Rong, Feng Zhao

研究方向: 计算机视觉与图像生成

本文研究了基于自回归(AR)模型的图像生成方法,针对传统AR模型在图像生成中的不足,提出了频率递增自回归(FAR)模型,并使用连续标记器进行实例化。

ID: 2503.05305v1来源: arxiv发布时间: 2025-03-10

Evidential Uncertainty Estimation for Multi-Modal Trajectory Prediction

作者: Sajad Marvi, Christoph Rist, Julian Schmidt, Julian Jordan, Abhinav Valada

研究方向: 自动驾驶中的多模态轨迹预测与不确定性估计

本文提出了一种基于证据深度学习的多模态轨迹预测方法,旨在解决自动驾驶中由于行为和感知噪声导致的不确定性挑战。该方法能够实时估计位置和模式概率的不确定性,并通过重要性采样策略提高训练效率。

ID: 2503.05274v1来源: arxiv发布时间: 2025-03-10

PhiloBERTA: A Transformer-Based Cross-Lingual Analysis of Greek and Latin Lexicons

作者: Rumi A. Allbert, Makai L. Allbert

研究方向: 古代语言语义分析与比较

PhiloBERTA是一项基于Transformer的跨语言模型,旨在分析古希腊和拉丁词汇之间的语义关系。它通过分析经典文本中选定的词对,使用上下文嵌入和角度相似性指标来确定精确的语义对齐。

ID: 2503.05265v1来源: arxiv发布时间: 2025-03-10

Jailbreaking is (Mostly) Simpler Than You Think

作者: Mark Russinovich, Ahmed Salem

研究方向: 人工智能安全与伦理

本文研究了一种名为“上下文合规攻击”(Context Compliance Attack,CCA)的新方法,该方法通过操纵对话历史来绕过人工智能(AI)系统的安全机制,从而触发被限制的行为。研究表明,这种方法可以绕过最先进的安全协议,并提出了减轻这种攻击的缓解策略。

ID: 2503.05264v1来源: arxiv发布时间: 2025-03-10

WritingBench: A Comprehensive Benchmark for Generative Writing

作者: Yuning Wu, Jiahao Mei, Ming Yan, Chenliang Li, SHaopeng Lai, Yuran Ren, Zijia Wang, Ji Zhang, Mengyue Wu, Qin Jin, Fei Huang

研究方向: 自然语言处理(NLP)与生成式写作

本文提出了一种名为WritingBench的综合基准,旨在评估大型语言模型(LLMs)在生成式写作方面的性能。该基准涵盖了六个核心写作领域和100个子领域,包括创意、说服、信息和技术写作,并通过一个查询依赖的评估框架来动态生成实例特定的评估标准。

ID: 2503.05244v1来源: arxiv发布时间: 2025-03-10