EgoBlind: Towards Egocentric Visual Assistance for the Blind People
作者: Junbin Xiao, Nanxin Huang, Hao Qiu, Zhulin Tao, Xun Yang, Richang Hong, Meng Wang, Angela Yao
研究方向: 视觉辅助与视觉语言模型
本文提出了EgoBlind,这是一个首个以盲人为对象,用于评估当代多模态大型语言模型(MLLMs)辅助能力的视觉问答(VQA)数据集。EgoBlind包含来自盲人日常生活场景的1200多段视频和4927个问题,这些问题由盲人直接提出或生成,以反映他们在各种场景下对视觉辅助的需求。