Integrating Biological and Machine Intelligence: Attention Mechanisms in Brain-Computer Interfaces

作者: Jiyuan Wang, Weishan Ye, Jialin He, Li Zhang, Gan Huang, Zhuliang Yu, Zhen Liang

研究方向: 脑机接口(BCI)与注意力机制

本文综述了传统和基于Transformer的注意力机制在脑电图(EEG)信号分析中的应用,重点关注多模态数据融合。通过捕捉EEG信号在时间、频率和空间通道上的变化,注意力机制提高了特征提取、表示学习和模型鲁棒性。文章探讨了现有挑战和新兴趋势,强调了BCI技术未来发展方向。

ID: 2502.19281v1来源: arxiv发布时间: 2025-02-27

Multiview graph dual-attention deep learning and contrastive learning for multi-criteria recommender systems

作者: Saman Forouzandeh, Pavel N. Krivitsky, Rohitash Chandra

研究方向: 多准则推荐系统

本文提出了一种名为D-MGAC的多准则推荐系统框架,该框架结合了多视图、双图注意力机制和对比学习,旨在解决传统推荐系统在处理多准则数据时的局限性。

ID: 2502.19271v1来源: arxiv发布时间: 2025-02-27

Drop-Upcycling: Training Sparse Mixture of Experts with Partial Re-initialization

作者: Taishi Nakamura, Takuya Akiba, Kazuki Fujii, Yusuke Oda, Rio Yokota, Jun Suzuki

研究方向: 自然语言处理(NLP)和机器学习(ML)

Drop-Upcycling 是一种从预训练的密集模型构建 Mixture of Experts (MoE) 模型的方法,旨在平衡知识迁移和专家专业化,以解决 MoE 模型开发中的关键挑战。

ID: 2502.19261v1来源: arxiv发布时间: 2025-02-27

EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving in the Arab Gulf Region

作者: Nadya Abdel Madjid, Murad Mebrahtu, Abdelmoamen Nasser, Bilal Hassan, Naoufel Werghi, Jorge Dias, Majid Khonji

研究方向: 自动驾驶

本文介绍了EMT数据集,这是首个公开的、在阿拉伯海湾地区收集的自动驾驶数据集。该数据集旨在解决当前自动驾驶数据集中对阿拉伯海湾地区独特驾驶条件的代表性不足的问题。

ID: 2502.19260v1来源: arxiv发布时间: 2025-02-27

Poster: Long PHP webshell files detection based on sliding window attention

作者: Zhiqiang Wang, Haoyu Wang, Lu Hao

研究方向: 网络安全与恶意代码检测

本文研究了基于滑动窗口注意力机制的PHP网络shell文件检测方法,针对传统检测方法在应对新型网络shell变种和反检测技术方面的不足,提出了新的数据预处理方法、特征表示和分类方法。

ID: 2502.19257v2来源: arxiv发布时间: 2025-02-28

Poster: Long PHP webshell files detection based on sliding window attention

作者: Zhiqiang Wang, Haoyu Wang, Lu Hao

研究方向: 网络安全与恶意代码检测

本文提出了一种基于滑动窗口注意力机制的PHP网络shell检测方法,旨在提高长文件网络shell检测的准确性。

ID: 2502.19257v1来源: arxiv发布时间: 2025-02-27

Can RLHF be More Efficient with Imperfect Reward Models? A Policy Coverage Perspective

作者: Jiawei Huang, Bingcong Li, Christoph Dann, Niao He

研究方向: 强化学习与人类反馈(RLHF)

该论文研究了在在线RLHF中利用不完美但相关的奖励模型来加速学习的方法。通过分析KL正则化RLHF目标的新特性,提出了一种理论上的迁移学习算法,该算法在标准在线学习算法的基础上具有可证明的优势。该方法在早期阶段通过快速适应最佳可用源奖励模型来减少后悔,随着时间的推移,它达到了与结构复杂度无关的O(T)后悔界限。

ID: 2502.19255v1来源: arxiv发布时间: 2025-02-27

GraphBridge: Towards Arbitrary Transfer Learning in GNNs

作者: Li Ju, Xingyi Yang, Qi Li, Xinchao Wang

研究方向: 图神经网络(GNN)的迁移学习

GraphBridge是一种新的框架,旨在实现GNN中不同任务和域之间的知识迁移,无需修改任务配置或图结构。它允许将任何预训练的GNN与预测头和连接输入到输出层的桥接网络进行增强。GraphBridge不仅保留了原始模型的内在知识,还支持任意维度的输出。为了减轻负迁移问题,GraphBridge将源模型与同时训练的模型合并,从而在应用于目标域时减少源偏差。

ID: 2502.19252v1来源: arxiv发布时间: 2025-02-27

Between Circuits and Chomsky: Pre-pretraining on Formal Languages Imparts Linguistic Biases

作者: Michael Y. Hu, Jackson Petty, Chuan Shi, William Merrill, Tal Linzen

研究方向: 自然语言处理,语言模型,预训练

本文研究了在形式语言上预训练语言模型对自然语言处理的影响,探讨了形式语言的特征如何影响预训练的效果,以及预训练对语言模型性能的提升。

ID: 2502.19249v1来源: arxiv发布时间: 2025-02-27

AI-Powered Bayesian Inference

作者: Veronika Ročková, Sean O'Hagan

研究方向: 人工智能与贝叶斯推理

本文研究了如何利用生成式人工智能(GAI)来构建贝叶斯推理中的先验分布,从而在贝叶斯框架下进行预测和不确定性量化。

ID: 2502.19231v1来源: arxiv发布时间: 2025-02-27