A Deep User Interface for Exploring LLaMa

作者: Divya Perumal, Swaroop Panda

研究方向: 大型语言模型(LLM)的可解释性和用户界面设计

本文提出了一种基于视觉分析的工具,用于探索大型语言模型(LLM)的输出,特别是通过调整关键超参数(如top-p、频率和存在惩罚)来影响模型生成文本的能力。该工具旨在提高用户对LLM的理解和交互能力。

ID: 2502.20938v1来源: arxiv发布时间: 2025-03-03

WebFAQ: A Multilingual Collection of Natural Q&A Datasets for Dense Retrieval

作者: Michael Dinzinger, Laura Caspari, Kanishka Ghosh Dastidar, Jelena Mitrović, Michael Granitzer

研究方向: 多语言信息检索和问答系统

WebFAQ项目旨在构建一个大规模的多语言问答数据集,用于信息检索和问答系统的研究与开发。

ID: 2502.20936v1来源: arxiv发布时间: 2025-03-03

Everything, Everywhere, All at Once: Is Mechanistic Interpretability Identifiable?

作者: Maxime Méloux, Silviu Maniu, François Portet, Maxime Peyrard

研究方向: 机器学习解释性

本文研究了机制可解释性(MI)在神经网络中的应用,特别是针对MI解释的唯一性问题。作者通过实验发现,在简单的任务和小的多层感知器(MLP)中,MI解释可能存在多个互斥的解释,这挑战了MI解释唯一性的直觉。

ID: 2502.20914v1来源: arxiv发布时间: 2025-03-03

DexGraspVLA: A Vision-Language-Action Framework Towards General Dexterous Grasping

作者: Yifan Zhong, Xuchuan Huang, Ruochong Li, Ceyao Zhang, Yitao Liang, Yaodong Yang, Yuanpei Chen

研究方向: 机器人与自动化

本文提出了一种名为DexGraspVLA的视觉-语言-动作框架,旨在实现通用灵活抓取。该框架利用预训练的视觉-语言模型作为高级任务规划器,并学习基于扩散的策略作为低级动作控制器。它通过迭代地将多种视觉和语言输入转换为领域不变表示,从而实现模仿学习,并有效缓解了领域偏移问题,从而在真实世界场景中实现鲁棒的泛化。

ID: 2502.20900v1来源: arxiv发布时间: 2025-03-03

A Fused Gromov-Wasserstein Approach to Subgraph Contrastive Learning

作者: Amadou S. Sangare, Nicolas Dunou, Jhony H. Giraldo, Fragkiskos D. Malliaros

研究方向: 图表示学习与自监督学习

本文提出了一种名为FOSSIL的融合Gromov-Wasserstein子图对比学习方法,用于自监督图表示学习。该方法结合了节点级和子图级对比学习,利用融合Gromov-Wasserstein距离同时捕捉节点特征和图结构,旨在解决现有方法在结构模式和节点相似性利用方面的不足。

ID: 2502.20885v1来源: arxiv发布时间: 2025-03-03

A Pilot Empirical Study on When and How to Use Knowledge Graphs as Retrieval Augmented Generation

作者: Xujie Yuan, Yongxu Liu, Shimin Di, Shiwen Wu, Libin Zheng, Rui Meng, Xiaofang Zhou, Lei Chen, Jian Yin

研究方向: 知识图谱增强检索生成(KG-RAG)方法的研究与应用

本文针对知识图谱增强检索生成(KG-RAG)方法在自然语言处理中的应用进行了深入研究。通过分析不同场景下的KG-RAG方法,探讨了何时以及如何使用KG-RAG方法来提升生成模型的性能。

ID: 2502.20854v1来源: arxiv发布时间: 2025-03-03

Oscillation-Reduced MXFP4 Training for Vision Transformers

作者: Yuxiang Chen, Haocheng Xi, Jun Zhu, Jianfei Chen

研究方向: 机器学习,低精度训练,视觉Transformer

本文提出了TetraJet,一种基于MXFP4格式的视觉Transformer训练方法,旨在提高4位精度训练的准确性,并通过引入EMA Quantizer(Q-EMA)和Adaptive Ramping Optimizer(Q-Ramping)来减少训练过程中的振荡问题。

ID: 2502.20853v1来源: arxiv发布时间: 2025-03-03

Reinforcement Learning with Curriculum-inspired Adaptive Direct Policy Guidance for Truck Dispatching

作者: Shi Meng, Bin Tian, Xiaotong Zhang

研究方向: 智能矿山管理与调度

本文研究了利用强化学习(RL)技术进行卡车调度,以解决露天矿开采中卡车调度算法的复杂性和动态不确定性问题。

ID: 2502.20845v1来源: arxiv发布时间: 2025-03-03

Neuro-Symbolic Learning for Galois Groups: Unveiling Probabilistic Trends in Polynomials

作者: Elira Shaska, Tony Shaska

研究方向: 神经符号学习在代数计算中的应用

本文提出了一种神经符号方法来对多项式的伽罗瓦群进行分类,将经典伽罗瓦理论与机器学习相结合,以解决代数计算中的挑战。通过结合神经网络与符号推理,利用根分布、特征和分解式等不变量,开发了一种在准确性和可解释性方面优于纯数值方法的模型。

ID: 2502.20844v1来源: arxiv发布时间: 2025-03-03

Hierarchical and Modular Network on Non-prehensile Manipulation in General Environments

作者: Yoonyoung Cho, Junhyek Han, Jisu Han, Beomjoon Kim

研究方向: 机器人非抓取操作与模拟

该研究提出了一种名为 HAMNET 的模块化架构,用于在模拟环境中进行非抓取操作。该架构结合了基于接触的对象和环境表示(UNICORN)以及用于构建多样化环境几何形状的程序生成算法。研究旨在提高机器人对各种环境和物体的非抓取操作能力。

ID: 2502.20843v1来源: arxiv发布时间: 2025-03-03