ERUPT: Efficient Rendering with Unposed Patch Transformer

作者: Maxim V. Shugaev, Vincent Chen, Maxim Karrenbach, Kyle Ashley, Bridget Kennedy, Naresh P. Cuntoor

研究方向: 计算机视觉、图像重建、3D场景生成

该研究提出了一种名为ERUPT的基于隐式场景表示的3D场景重建模型,该模型能够利用未定位的图像高效地渲染新视图。ERUPT通过引入基于补丁的查询方法,提高了渲染效率,并在保持高图像质量的同时,大幅降低了计算需求。

ID: 2503.24374v1来源: arxiv发布时间: 2025-04-02

Policy Gradient for LQR with Domain Randomization

作者: Tesshu Fujinami, Bruce D. Lee, Nikolai Matni, George J. Pappas

研究方向: 机器人控制与强化学习

该研究主要探讨了在具有领域随机化的线性二次调节(LQR)问题中,使用策略梯度方法进行控制器训练的收敛性。领域随机化通过在训练过程中随机化模拟器参数,以增强控制器对真实世界系统变化的鲁棒性。

ID: 2503.24371v1来源: arxiv发布时间: 2025-04-02

Effectively Controlling Reasoning Models through Thinking Intervention

作者: Tong Wu, Chong Xiang, Jiachen T. Wang, Prateek Mittal

研究方向: 大型语言模型(LLM)的推理过程控制

本文提出了一种名为“思维干预”的新范式,旨在通过在推理过程中插入或修改特定的思维标记来显式地引导大型语言模型(LLM)的内部推理过程。该研究旨在提高LLM在复杂任务中的表现,并增强模型行为的可控性。

ID: 2503.24370v1来源: arxiv发布时间: 2025-04-02

Adapting Vision Foundation Models for Real-time Ultrasound Image Segmentation

作者: Xiaoran Zhang, Eric Z. Chen, Lin Zhao, Xiao Chen, Yikang Liu, Boris Maihe, James S. Duncan, Terrence Chen, Shanhui Sun

研究方向: 医学图像处理,超声图像分割

提出了一种新的超声图像分割方法,该方法通过调整视觉基础模型来提高分割的准确性和实时性。

ID: 2503.24368v1来源: arxiv发布时间: 2025-04-02

StochasticSplats: Stochastic Rasterization for Sorting-Free 3D Gaussian Splatting

作者: Shakiba Kheradmand, Delio Vicini, George Kopanas, Dmitry Lagun, Kwang Moo Yi, Mark Matthews, Andrea Tagliasacchi

研究方向: 计算机图形学与三维可视化

本文提出了一种名为StochasticSplats的3D高斯喷溅随机光栅化方法,旨在解决传统3D高斯喷溅方法中存在的排序、渲染性能和可移植性问题。

ID: 2503.24366v1来源: arxiv发布时间: 2025-04-03

Which LIME should I trust? Concepts, Challenges, and Solutions

作者: Patrick Knab, Sascha Marton, Udo Schlegel, Christian Bartelt

研究方向: 可解释人工智能(XAI)与LIME技术

本文对LIME(Local Interpretable Model-agnostic Explanations)技术进行了全面且系统的综述,分析了其演变、局限性以及研究挑战。文章重点介绍了LIME的各种变体和改进,并提出了一个新颖的分类框架,将LIME扩展按照技术修改和应用问题进行分类。

ID: 2503.24365v1来源: arxiv发布时间: 2025-04-02

Query and Conquer: Execution-Guided SQL Generation

作者: Łukasz Borchmann, Marek Wydmuch

研究方向: 自然语言处理与数据库查询生成

该研究提出了一种基于执行结果的SQL生成方法,通过评估多个候选查询的语义一致性,在保证准确性的同时显著降低了推理成本。该方法能够有效地处理结构相似但语义不同的查询,使得小型模型能够超越计算密集型方法,并在成本效益方面取得显著提升。

ID: 2503.24364v1来源: arxiv发布时间: 2025-04-02

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

作者: Abhiram Maddukuri, Zhenyu Jiang, Lawrence Yunliang Chen, Soroush Nasiriany, Yuqi Xie, Yu Fang, Wenqi Huang, Zu Wang, Zhenjia Xu, Nikita Chernyadev, Scott Reed, Ken Goldberg, Ajay Mandlekar, Linxi Fan, Yuke Zhu

研究方向: 机器人视觉操作与模拟数据利用

该研究旨在通过结合模拟数据和真实世界数据来训练机器人视觉操作策略,以减少对真实世界数据的依赖,并提高机器人操作的性能和泛化能力。

ID: 2503.24361v2来源: arxiv发布时间: 2025-04-03

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

作者: Abhiram Maddukuri, Zhenyu Jiang, Lawrence Yunliang Chen, Soroush Nasiriany, Yuqi Xie, Yu Fang, Wenqi Huang, Zu Wang, Zhenjia Xu, Nikita Chernyadev, Scott Reed, Ken Goldberg, Ajay Mandlekar, Linxi Fan, Yuke Zhu

研究方向: 机器人学与机器学习

本文研究了如何有效地利用由物理模拟生成的数据来解决现实世界的视觉机器人操作任务。作者提出了一种将模拟数据和现实世界数据结合的协同训练方法,以解决现实世界数据收集的挑战。

ID: 2503.24361v1来源: arxiv发布时间: 2025-04-02

SQuat: Subspace-orthogonal KV Cache Quantization

作者: Hao Wang, Ligong Han, Kai Xu, Akash Srivastava

研究方向: 人工智能,大型语言模型(LLM)的推理优化

本文研究如何通过量化和压缩关键值(KV)缓存来优化LLM的推理效率,从而减少内存使用并提高吞吐量。

ID: 2503.24358v1来源: arxiv发布时间: 2025-04-02