你的位置:斗鱼体育(DouYuSports)官网入口 > 斗鱼app下载 > 斗鱼体育app CVPR 2026新增赛谈!EgoCross挑战赛:用四大杀手级场景,磨真金不怕火多模态大模子泛化极限
斗鱼体育app CVPR 2026新增赛谈!EgoCross挑战赛:用四大杀手级场景,磨真金不怕火多模态大模子泛化极限
发布日期:2026-02-26 00:05    点击次数:60

斗鱼体育app CVPR 2026新增赛谈!EgoCross挑战赛:用四大杀手级场景,磨真金不怕火多模态大模子泛化极限

EgoVis(Joint Egocentric Vision Workshop)是比年来各人第一视角视觉(Egocentric Vision)畛域最具影响力的学术行动之一,已连气儿三年在 CVPR 时间聚集举办,汇注了来孤高众顶级高校与测度机构的前沿效果与编削想想。当作迷惑第一视角判辨、具身智能与多模态学习的进击平台,EgoVis 握续鼓吹 egocentric 视频判辨、ego-exo 关系建模、具身有计算等标的的发展。

依托CVPR 2026 EgoVis Workshop,重磅推出EgoCross(Cross-Domain Egocentric Video QA)挑战赛,旨在鼓吹多模态谎言语模子(MLLMs)在跨域第一视角视频问答中的泛化才调与推理才调。

本次挑战赛为各人测度者提供了一个高尺度、绽放式的评测平台,饱读动探索更具鲁棒性与可迁徙性的模子设施。本次挑战赛现已发达面向各人测度者开启报名!要是你辛勤于多模态谎言语模子(MLLMs)、视频问答(VideoQA)或是第一东谈主称视角(Egocentric Vision)智能的测度,诚邀眷注并参与本次竞赛,共同鼓吹第一东谈主称智能判辨的前沿发展。

一、大赛配景

现时的多模态大模子在宽泛场景的视频判辨上还是赢得了显赫进展,但当它们面对未知、复杂、高度专科化的信得过宇宙场景时,延续会面对严重的泛化瓶颈。

为了探索和冲破这一极限,附近方推出了EgoCross Benchmark(AAAI 2026)。不同于以往局限于"炒菜"、"作念家务"等宽泛数据集,EgoCross 聚焦于高难度跨畛域的第一视角视频,斗鱼体育app旨在全面评估模子在不同视觉和语义条款下的鲁棒性与零样本 / 少样本泛化才调。

二、大赛任务先容

任务态状:给定一段来自全新畛域的第一视角视频,参赛模子需要针对给定的问题,从 4 个选项中准确推理并遴荐正确谜底(Multiple-choice VideoQA)。

为了全面磨真金不怕火模子的跨畛域相宜力,本次挑战赛精选了四大特点畛域:

外科手术(Surgery) :要求良好的器械识别、手术阶段判辨与手部交互推理。

工业安装(Industry) :侧重零部件识别、操作经过推理与用具使用逻辑。

极限通顺(Extreme Sports) :包含高速第一视角通顺、导航痕迹与时序展望。

动物视角(Animal Perspective) :涵盖物种痕迹、非东谈主类通顺样式与行动判辨。

数据集共包含 798 个视频片断和 957 个 QA 对,全面遮盖识别、定位、展望和计数统统 4 大类任务的 15 个子任务。具体任务界说可参考论文。

也可通过之前团队的投稿著作来了解更多:准确率腰斩!大模子视觉才调一出宽泛生存就「失灵」

三、双赛谈开荒,赋闲不同测度需求

本次挑战赛在 Codabench 平台分为两个赛谈,参赛团队可笔据本人的测度标的和盘算推算资源遴荐参与:

赛谈一:受限资源赛谈(Source-Limited Track)

轨则:参赛者仅能使用官方提供的基线模子和极小数的撑握集(Support Set)进行微调或率领。

中枢主见:测试跨域泛化才调并比拟不同微调设施的效果。

评测进口:https://www.codabench.org/competitions/11279/

赛谈二:开源赛谈(Open-Source Track)

轨则:对基础模子莫得任何死心(饱读动使用各类开源或买卖闭源模子进行测试),允许使用至极的推行数据(前提是不成东谈主为针对主见畛域进行相当构造)。

中枢主见:饱读动编削地期骗更强劲模子或算法进步跨域泛化才调。

评测进口:https://www.codabench.org/competitions/13868/

(注:现时官方提供的 SFT-Qwen3VL 基线模子在四大畛域的平均准确率仅为 0.4608,仍有弘大的进步空间恭候诸君测度者来冲破!)

四、评测平台及谈论

竞赛平台:挑战赛将在Codabench平台进行,两个赛谈分袂对应孤独评测页面。

评测谈论:模子在测试集上的Multiple-choice VideoQA 准确率(Accuracy)当作主要排行依据(最终排行与评奖确定以各赛谈官方页面讲解为准)。

讲解:得益优异的团队将受邀按照EgoVis Workshop的投稿要求提交时刻论说,并有契机在 CVPR 2026 Workshop 展示测度效果。

五、数据 & 基线

为了让参赛者概况无缝切入研发,组委会已开源全套经过代码与数据集:

官方主页:EgoCross Benchmark 官网(https://egocross-benchmark.github.io/)

会议信息:CVPR 2026 EgoVis Workshop 主页(https://egovis.github.io/cvpr26/#)

评测推理代码:EgoCrossCodes ( GitHub ) (https://github.com/MyUniverse0726/EgoCross)

推行微调代码:基于 Qwen3VL-4B 的 EgoCross_SFT_qwen3vl4b ( https://github.com/LiYu0524/EgoCross_SFT_qwen3vl4b )

六、进击日程(太平洋时候 PT)

评测榜单情景:现已绽放

{jz:field.toptypename/}

评测榜单截止:2026 年 5 月 13 日

时刻论说提交截止:2026 年 5 月 20 日

获奖奉告:2026 年 5 月 27 日

CVPR 谈判会时候:2026 年 6 月 3 日 - 4 日

七、组织者团队

八、报名与讨论

如有任何疑问,宽贷扫描下方二维码或者干系组织者加入官方疏浚群:

宽贷各大高校实验室、测度机构及企业团队奋勇报名!点击下方通达或打听官网,立即组建战队向榜单发起冲击。

{jz:field.toptypename/}

一键三连「点赞」「转发」「阻拦心」

宽贷在驳倒区留住你的想法!

—  完  —

咱们正在招聘别称眼疾手快、眷注 AI 的学术剪辑实习生  � �

感趣味趣味的小伙伴宽贷眷注 � �  了解详情

� � 点亮星标 � �

科技前沿进展逐日见