

EgoVis(Joint Egocentric Vision Workshop)是比年来各人第一视角视觉(Egocentric Vision)畛域最具影响力的学术行动之一,已连气儿三年在 CVPR 时间聚集举办,汇注了来孤高众顶级高校与测度机构的前沿效果与编削想想。当作迷惑第一视角判辨、具身智能与多模态学习的进击平台,EgoVis 握续鼓吹 egocentric 视频判辨、ego-exo 关系建模、具身有计算等标的的发展。
依托CVPR 2026 EgoVis Workshop,重磅推出EgoCross(Cross-Domain Egocentric Video QA)挑战赛,旨在鼓吹多模态谎言语模子(MLLMs)在跨域第一视角视频问答中的泛化才调与推理才调。
本次挑战赛为各人测度者提供了一个高尺度、绽放式的评测平台,饱读动探索更具鲁棒性与可迁徙性的模子设施。本次挑战赛现已发达面向各人测度者开启报名!要是你辛勤于多模态谎言语模子(MLLMs)、视频问答(VideoQA)或是第一东谈主称视角(Egocentric Vision)智能的测度,诚邀眷注并参与本次竞赛,共同鼓吹第一东谈主称智能判辨的前沿发展。
一、大赛配景
现时的多模态大模子在宽泛场景的视频判辨上还是赢得了显赫进展,但当它们面对未知、复杂、高度专科化的信得过宇宙场景时,延续会面对严重的泛化瓶颈。
为了探索和冲破这一极限,附近方推出了EgoCross Benchmark(AAAI 2026)。不同于以往局限于"炒菜"、"作念家务"等宽泛数据集,EgoCross 聚焦于高难度跨畛域的第一视角视频,斗鱼体育app旨在全面评估模子在不同视觉和语义条款下的鲁棒性与零样本 / 少样本泛化才调。
二、大赛任务先容
任务态状:给定一段来自全新畛域的第一视角视频,参赛模子需要针对给定的问题,从 4 个选项中准确推理并遴荐正确谜底(Multiple-choice VideoQA)。
为了全面磨真金不怕火模子的跨畛域相宜力,本次挑战赛精选了四大特点畛域:

外科手术(Surgery) :要求良好的器械识别、手术阶段判辨与手部交互推理。
工业安装(Industry) :侧重零部件识别、操作经过推理与用具使用逻辑。
极限通顺(Extreme Sports) :包含高速第一视角通顺、导航痕迹与时序展望。
动物视角(Animal Perspective) :涵盖物种痕迹、非东谈主类通顺样式与行动判辨。
数据集共包含 798 个视频片断和 957 个 QA 对,全面遮盖识别、定位、展望和计数统统 4 大类任务的 15 个子任务。具体任务界说可参考论文。
也可通过之前团队的投稿著作来了解更多:准确率腰斩!大模子视觉才调一出宽泛生存就「失灵」
三、双赛谈开荒,赋闲不同测度需求
本次挑战赛在 Codabench 平台分为两个赛谈,参赛团队可笔据本人的测度标的和盘算推算资源遴荐参与:
赛谈一:受限资源赛谈(Source-Limited Track)
轨则:参赛者仅能使用官方提供的基线模子和极小数的撑握集(Support Set)进行微调或率领。
中枢主见:测试跨域泛化才调并比拟不同微调设施的效果。
评测进口:https://www.codabench.org/competitions/11279/
赛谈二:开源赛谈(Open-Source Track)
轨则:对基础模子莫得任何死心(饱读动使用各类开源或买卖闭源模子进行测试),允许使用至极的推行数据(前提是不成东谈主为针对主见畛域进行相当构造)。
中枢主见:饱读动编削地期骗更强劲模子或算法进步跨域泛化才调。
评测进口:https://www.codabench.org/competitions/13868/
(注:现时官方提供的 SFT-Qwen3VL 基线模子在四大畛域的平均准确率仅为 0.4608,仍有弘大的进步空间恭候诸君测度者来冲破!)
四、评测平台及谈论
竞赛平台:挑战赛将在Codabench平台进行,两个赛谈分袂对应孤独评测页面。
评测谈论:模子在测试集上的Multiple-choice VideoQA 准确率(Accuracy)当作主要排行依据(最终排行与评奖确定以各赛谈官方页面讲解为准)。
讲解:得益优异的团队将受邀按照EgoVis Workshop的投稿要求提交时刻论说,并有契机在 CVPR 2026 Workshop 展示测度效果。
五、数据 & 基线
为了让参赛者概况无缝切入研发,组委会已开源全套经过代码与数据集:
官方主页:EgoCross Benchmark 官网(https://egocross-benchmark.github.io/)
会议信息:CVPR 2026 EgoVis Workshop 主页(https://egovis.github.io/cvpr26/#)
评测推理代码:EgoCrossCodes ( GitHub ) (https://github.com/MyUniverse0726/EgoCross)
推行微调代码:基于 Qwen3VL-4B 的 EgoCross_SFT_qwen3vl4b ( https://github.com/LiYu0524/EgoCross_SFT_qwen3vl4b )
六、进击日程(太平洋时候 PT)
评测榜单情景:现已绽放
{jz:field.toptypename/}评测榜单截止:2026 年 5 月 13 日
时刻论说提交截止:2026 年 5 月 20 日
获奖奉告:2026 年 5 月 27 日
CVPR 谈判会时候:2026 年 6 月 3 日 - 4 日
七、组织者团队

八、报名与讨论
如有任何疑问,宽贷扫描下方二维码或者干系组织者加入官方疏浚群:

宽贷各大高校实验室、测度机构及企业团队奋勇报名!点击下方通达或打听官网,立即组建战队向榜单发起冲击。
一键三连「点赞」「转发」「阻拦心」
宽贷在驳倒区留住你的想法!
— 完 —
咱们正在招聘别称眼疾手快、眷注 AI 的学术剪辑实习生 � �
感趣味趣味的小伙伴宽贷眷注 � � 了解详情

� � 点亮星标 � �
科技前沿进展逐日见