How Far are LLMs from Real Search? A Comprehensive Study on Efficiency, Completeness, and Inherent Capabilities

作者: Minhua Lin, Hui Liu, Xianfeng Tang, Jingying Zeng, Zhenwei Dai, Chen Luo, Zheng Li, Xiang Zhang, Qi He, Suhang Wang

研究方向: 自然语言处理与搜索算法

本文研究了如何将学习与搜索算法相结合,以提高大型语言模型(LLMs)在解决复杂问题时的效率和准确性。通过提出SEAL和SEAL-C框架,本文探索了如何利用LLMs的推理能力来指导搜索过程,并确保搜索的完整性和效率。

ID: 2502.18387v1来源: arxiv发布时间: 2025-02-27

EgoSim: An Egocentric Multi-view Simulator and Real Dataset for Body-worn Cameras during Motion and Activity

作者: Dominik Hollidt, Paul Streli, Jiaxi Jiang, Yasaman Haghighi, Changlin Qian, Xintong Liu, Christian Holz

研究方向: 人体运动捕捉与 Egocentric 视觉感知

EgoSim 是一个用于模拟佩戴式摄像头的多视角模拟器,可以生成真实的人体运动渲染图像。MultiEgoView 是一个包含六台佩戴式摄像头和全身 3D 姿势的 egocentric 视频数据集。研究通过 EgoSim 和 MultiEgoView,训练了一个端到端的视频 3D 姿势估计网络,并分析了模拟数据和真实数据之间的差距。

ID: 2502.18373v1来源: arxiv发布时间: 2025-02-27

MindMem: Multimodal for Predicting Advertisement Memorability Using LLMs and Deep Learning

作者: Sepehr Asgarian, Qayam Jetha, Jouhyun Jeon

研究方向: 广告记忆度预测与广告内容优化

该研究提出了一种名为MindMem的多模态预测模型,用于预测广告的记忆度。MindMem通过整合文本、视觉和听觉数据,实现了在LAMBDA和Memento10K数据集上达到最先进的性能。此外,研究还引入了MindMem-ReAd系统,通过基于大型语言模型的模拟来优化广告内容和位置,从而显著提高广告的记忆度。

ID: 2502.18371v1来源: arxiv发布时间: 2025-02-27

Which Contributions Deserve Credit? Perceptions of Attribution in Human-AI Co-Creation

作者: Jessica He, Stephanie Houde, Justin D. Weisz

研究方向: 人机协同创作与归因

本文探讨了在人类与人工智能协同创作过程中,如何对人工智能的贡献进行归因。通过调查研究了知识工作者对归因的看法,分析了不同贡献类型、数量和主动性下人工智能应获得的不同程度的信用。

ID: 2502.18357v1来源: arxiv发布时间: 2025-02-27

From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms

作者: Manuel Barusco, Francesco Borsatti, Davide Dalle Pezze, Francesco Paissan, Elisabetta Farella, Gian Antonio Susto

研究方向: 音频异常检测(AAD)

该研究旨在将视觉异常检测(VAD)技术应用于音频领域,以解决音频异常检测问题。研究重点关注利用预训练的特征提取器生成的嵌入来检测音频信号中的异常。

ID: 2502.18328v1来源: arxiv发布时间: 2025-02-27

GraphRank Pro+: Advancing Talent Analytics Through Knowledge Graphs and Sentiment-Enhanced Skill Profiling

作者: Sirisha Velampalli, Chandrashekar Muniyappa

研究方向: 人才分析与半结构化数据处理

本文提出了一种名为GraphRank Pro+的创新方法,旨在通过知识图谱和情感增强的技能配置文件来提升人才分析。该方法能够从半结构化文本(如简历)中提取信息,并利用图结构、自然语言处理(NLP)和深度学习技术进行精确的信息提取和复杂查询。

ID: 2502.18315v1来源: arxiv发布时间: 2025-02-27

Smart and Efficient IoT-Based Irrigation System Design: Utilizing a Hybrid Agent-Based and System Dynamics Approach

作者: Taha Ahmadi Pargo, Mohsen Akbarpour Shirazi, Dawud Fadai

研究方向: 智能灌溉系统设计,物联网(IoT)应用,系统动力学与基于代理的建模

该研究设计了一种基于物联网的智能灌溉系统,旨在减少水资源浪费并优化灌溉效率。系统利用了系统动力学和基于代理的建模方法,结合了 Prometheus 方法论和 AnyLogic 模拟软件。系统通过传感器监测土壤湿度,并基于土壤水分动态模型和灌溉控制代理进行决策。

ID: 2502.18298v1来源: arxiv发布时间: 2025-02-27

Mixing Any Cocktail with Limited Ingredients: On the Structure of Payoff Sets in Multi-Objective MDPs and its Impact on Randomised Strategies

作者: James C. A. Main, Mickael Randour

研究方向: 多目标马尔可夫决策过程(Multi-objective Markov Decision Processes, MDPs)与随机策略

本文研究了在多目标马尔可夫决策过程中,如何通过有限数量的纯策略混合来近似或精确地获得任何期望收益向量。作者探讨了期望收益集的结构,并分析了随机化策略对策略复杂性的影响。

ID: 2502.18296v1来源: arxiv发布时间: 2025-02-27

AMPO: Active Multi-Preference Optimization

作者: Taneesh Gupta, Rahul Madhavan, Xuchao Zhang, Chetan Bansal, Saravan Rajmohan

研究方向: 多偏好优化与自我玩语言模型对齐

本文提出了一种名为AMPO(主动多偏好优化)的框架,用于自我玩语言模型对齐。该框架结合了策略生成、多偏好组对比损失和主动子集选择,旨在通过选择具有不同评分和语义的代表性响应子集来优化偏好。

ID: 2502.18293v1来源: arxiv发布时间: 2025-02-27

Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support

作者: Guoxin Wang, Minyu Gao, Shuai Yang, Ya Zhang, Lizhi He, Liang Huang, Hanlin Xiao, Yexuan Zhang, Wanyue Li, Lu Chen, Jintao Fei, Xin Li

研究方向: 医学语言模型与医疗决策支持

本文介绍了一种名为Citrus的医学语言模型,该模型通过模拟医疗专家的认知过程,实现了临床诊断和治疗中的复杂推理过程。模型基于模拟专家疾病推理数据集进行训练,该数据集通过新颖的方法合成,能够准确捕捉临床医生的决策路径。

ID: 2502.18274v2来源: arxiv发布时间: 2025-02-27