Large Language Models for Outpatient Referral: Problem Definition, Benchmarking and Challenges

作者: Xiaoxiao Liu, Qingying Xiao, Junying Chen, Xiangyi Feng, Xiangbo Wu, Bairui Zhang, Xiang Wan, Jian Chang, Guangjun Yu, Yan Hu, Benyou Wang

研究方向: 医疗资源分配与智能导诊系统

本研究探讨了大型语言模型(LLM)在智能门诊导诊(IOR)系统中的应用,旨在通过评估LLM在静态分类和动态交互对话中的能力来优化患者转诊流程。

ID: 2503.08292v1来源: arxiv发布时间: 2025-03-12

OminiControl2: Efficient Conditioning for Diffusion Transformers

作者: Zhenxiong Tan, Qiaochu Xue, Xingyi Yang, Songhua Liu, Xinchao Wang

研究方向: 计算机视觉,自然语言处理,图像生成

本文提出了一种名为OminiControl2的框架,用于提高扩散模型(DiT)在图像生成中的控制能力,特别是在多条件输入的情况下。该框架通过压缩和重用条件特征来降低计算成本,同时保持生成质量。

ID: 2503.08280v1来源: arxiv发布时间: 2025-03-12

Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models

作者: Ruibin Xiong, Yimeng Chen, Dmitrii Khizbullin, Jürgen Schmidhuber

研究方向: 长文本生成与写作

本文提出了一种基于异构递归规划的框架,用于自适应长文本写作。该框架通过递归任务分解和动态集成检索、推理和创作三种基本任务类型,实现类似人类的自适应写作。

ID: 2503.08275v1来源: arxiv发布时间: 2025-03-12

Adv-CPG: A Customized Portrait Generation Framework with Facial Adversarial Attacks

作者: Junying Wang, Hongyuan Zhang, Yuan Yuan

研究方向: 人工智能,计算机视觉,图像生成

该研究提出了一种名为Adv-CPG的定制肖像生成框架,结合了面部对抗攻击技术,旨在生成既能满足个性化需求,又能保护面部隐私的肖像图像。

ID: 2503.08269v1来源: arxiv发布时间: 2025-03-13

DexGrasp Anything: Towards Universal Robotic Dexterous Grasping with Physics Awareness

作者: Yiming Zhong, Qi Jiang, Jingyi Yu, Yuexin Ma

研究方向: 机器人学,机器学习,机器人感知与操作

该研究旨在开发一种能够抓取任意物体的灵活机器人手,通过将物理约束整合到基于扩散的生成模型中,实现通用且鲁棒的抓取。

ID: 2503.08257v1来源: arxiv发布时间: 2025-03-12

MT-NAM: An Efficient and Adaptive Model for Epileptic Seizure Detection

作者: Arshia Afzal, Volkan Cevher, Mahsa Shoaran

研究方向: 癫痫检测与神经信号处理

本文研究了基于脑电图(EEG)的癫痫发作检测,提出了一种名为MT-NAM(基于微树结构的NAM)的高效且自适应的模型。该模型通过知识蒸馏和在线更新机制,在保证检测准确性的同时,显著提高了检测速度。

ID: 2503.08251v1来源: arxiv发布时间: 2025-03-12

Aligning Text to Image in Diffusion Models is Easier Than You Think

作者: Jaa-Yeon Lee, Byunghee Cha, Jeongsol Kim, Jong Chul Ye

研究方向: 多模态生成模型,特别是文本到图像生成模型的研究

该论文提出了SoftREPA(Soft Representation Alignment)方法,旨在通过轻量级的微调策略和软文本标记来改善文本到图像生成模型中的文本图像对齐问题。

ID: 2503.08250v1来源: arxiv发布时间: 2025-03-12

HASARD: A Benchmark for Vision-Based Safe Reinforcement Learning in Embodied Agents

作者: Tristan Tomilin, Meng Fang, Mykola Pechenizkiy

研究方向: 视觉基础安全强化学习

本文介绍了HASARD,这是一个针对视觉基础安全强化学习(Safe RL)的基准测试套件。HASARD旨在解决现有视觉基准测试仅考虑简单导航任务的不足,提供了一个包含多种复杂任务的3D环境,以评估和比较Safe RL方法。

ID: 2503.08241v1来源: arxiv发布时间: 2025-03-12

Investigating Execution-Aware Language Models for Code Optimization

作者: Federico Di Menna, Luca Traini, Gabriele Bavota, Vittorio Cortellessa

研究方向: 代码优化与语言模型

该研究旨在探究将代码执行信息整合到语言模型中,对代码优化能力的影响。研究人员通过训练12种基于CodeT5+的执行感知语言模型,评估了不同代码执行方面和训练策略对代码优化效果的影响。

ID: 2503.08228v1来源: arxiv发布时间: 2025-03-12

A Grey-box Text Attack Framework using Explainable AI

作者: Esther Chiramal, Kelvin Soh Boon Kai

研究方向: 人工智能安全与可解释人工智能

该研究提出了一种基于可解释人工智能的灰盒文本攻击框架,旨在利用可解释人工智能技术来生成对抗样本,攻击预训练的BERT模型。该框架通过分析词的重要性,用同义词替换原文中的词汇,生成对抗样本,并验证了攻击在不同Transformer模型之间的可迁移性。

ID: 2503.08226v1来源: arxiv发布时间: 2025-03-12