InstructRestore: Region-Customized Image Restoration with Human Instructions

作者: Shuaizheng Liu, Jianqi Ma, Lingchen Sun, Xiangtao Kong, Lei Zhang

研究方向: 计算机视觉,图像恢复,自然语言处理

本文提出了一种名为InstructRestore的新框架,用于根据用户指令进行区域定制化的图像恢复。该框架能够理解用户指令,并根据指令对指定区域进行精确恢复,同时适当处理背景区域的恢复。

ID: 2503.24357v1来源: arxiv发布时间: 2025-04-02

ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion

作者: Rana Muhammad Shahroz Khan, Dongwen Tang, Pingzhi Li, Kai Wang, Tianlong Chen

研究方向: 低秩自适应(LoRA)和条件循环扩散模型在大型语言模型中的应用

该研究提出了一种名为ORAL的基于条件循环扩散的框架,用于生成大规模LoRA参数,以实现大型语言模型的快速适应和高效扩展。

ID: 2503.24354v1来源: arxiv发布时间: 2025-04-02

PathOrchestra: A Comprehensive Foundation Model for Computational Pathology with Over 100 Diverse Clinical-Grade Tasks

作者: Fang Yan, Jianfeng Wu, Jiawen Li, Wei Wang, Jiaxuan Lu, Wen Chen, Zizhao Gao, Jianan Li, Hong Yan, Jiabo Ma, Minda Chen, Yang Lu, Qing Chen, Yizhi Wang, Xitong Ling, Xuenian Wang, Zihan Wang, Qiang Huang, Shengyi Hua, Mianxin Liu, Lei Ma, Tian Shen, Xiaofan Zhang, Yonghong He, Hao Chen, Shaoting Zhang, Zhe Wang

研究方向: 计算病理学与人工智能

PathOrchestra 是一种基于自监督学习的病理学基础模型,用于处理高分辨率病理图像。该模型在包含 300K 病理切片的 20 种不同组织和器官类型的数据集上进行训练,并在 112 个临床任务上进行了严格评估。

ID: 2503.24345v1来源: arxiv发布时间: 2025-04-02

Contextual Preference Collaborative Measure Framework Based on Belief System

作者: Hang Yu, Wei Wei, Zheng Tan, Jing-lei Liu

研究方向: 数据挖掘与推荐系统

本文提出了一种基于信任系统的条件偏好协同度量框架,旨在减少偏好度量过程中的人为干预,同时提高偏好度量算法的效率和准确性。该框架通过构建信任系统,结合规则集聚合算法和有趣度度量标准,实现对上下文偏好规则的精准度量。

ID: 2503.24328v1来源: arxiv发布时间: 2025-04-02

Self-Supervised Pretraining for Aerial Road Extraction

作者: Rupert Polley, Sai Vignesh Abishek Deenadayalan, J. Marius Zöllner

研究方向: 自动驾驶与遥感图像处理

该论文提出了一种基于自监督预训练的空中道路提取方法,旨在解决深度神经网络在空中图像分割任务中需要大量标注数据的问题。

ID: 2503.24326v2来源: arxiv发布时间: 2025-04-03

Pro-Routing: Proactive Routing of Autonomous Multi-Capacity Robots for Pickup-and-Delivery Tasks

作者: Daniel Garces, Stephanie Gil

研究方向: 多机器人任务规划与决策

本文研究多机器人协同完成任务,特别是多容量机器人执行取送任务。提出了一个基于主动规划的路线框架,该框架能够适应实时需求,同时保证学习到的路线策略的稳定性。

ID: 2503.24325v1来源: arxiv发布时间: 2025-04-02

Can Test-Time Scaling Improve World Foundation Model?

作者: Wenyan Cong, Hanqing Zhu, Peihao Wang, Bangya Liu, Dejia Xu, Kevin Wang, David Z. Pan, Yan Wang, Zhiwen Fan, Zhangyang Wang

研究方向: 世界基础模型(World Foundation Models, WFMs)测试时间缩放

本文研究了如何通过测试时间缩放来提高世界基础模型(WFMs)的性能。WFMs通过预测未来状态来模拟物理世界,广泛应用于自动驾驶、机器人等领域。然而,它们在预训练和后训练阶段都需要大量的计算资源。本文提出了SWIFT,一个针对WFMs的测试时间缩放框架,通过在推理过程中分配额外的计算资源,提高了模型的性能,而无需重新训练或增加模型大小。

ID: 2503.24320v1来源: arxiv发布时间: 2025-04-02

BEATS: Bias Evaluation and Assessment Test Suite for Large Language Models

作者: Alok Abhishek, Lisa Erickson, Tushar Bandopadhyay

研究方向: 人工智能伦理与公平性

本文介绍了一个名为BEATS的框架,用于评估大型语言模型(LLM)中的偏见、伦理、公平性和事实性。该框架通过一个包含29个不同指标的基准,对LLM的输出进行量化评估,以确定其潜在的社会偏见和系统性不平等风险。

ID: 2503.24310v1来源: arxiv发布时间: 2025-04-02

A Systematic Evaluation of LLM Strategies for Mental Health Text Analysis: Fine-tuning vs. Prompt Engineering vs. RAG

作者: Arshia Kermani, Veronica Perez-Rosas, Vangelis Metsis

研究方向: 心理健康文本分析中的大语言模型(LLM)策略研究

该研究对比了三种LLM策略(微调、提示工程、检索增强生成)在心理健康文本分析中的应用,包括情绪分类和心理健康状况检测。使用LLaMA 3模型在两个数据集上评估了这些方法。

ID: 2503.24307v1来源: arxiv发布时间: 2025-04-02

Point Tracking in Surgery--The 2024 Surgical Tattoos in Infrared (STIR) Challenge

作者: Adam Schmidt, Mert Asim Karaoglu, Soham Sinha, Mingang Jang, Ho-Gun Ha, Kyungmin Jung, Kyeongmo Gu, Ihsan Ullah, Hyunki Lee, Jonáš Šerých, Michal Neoral, Jiří Matas, Rulin Zhou, Wenlong He, An Wang, Hongliang Ren, Bruno Silva, Sandro Queirós, Estêvão Lima, João L. Vilaça, Shunsuke Kikuchi, Atsushi Kouno, Hiroki Matsuzaki, Tongtong Li, Yulu Chen, Ling Li, Xiang Ma, Xiaojian Li, Mona Sheikh Zeinoddin, Xu Wang, Zafer Tandogdu, Greg Shaw, Evangelos Mazomenos, Danail Stoyanov, Yuxin Chen, Zijian Wu, Alexander Ladikos, Simon DiMaio, Septimiu E. Salcudean, Omid Mohareri

研究方向: 医学图像处理与计算机辅助手术

本文介绍了2024年Surgical Tattoos in Infrared (STIR)挑战赛,旨在推动手术中点跟踪和重建方法的改进,以更好地理解组织运动,从而实现下游任务如分割、3D重建、虚拟组织地标标记、基于探针的自动扫描和子任务自主性。

ID: 2503.24306v1来源: arxiv发布时间: 2025-04-03