赛事 | 总奖金池超12万美金！CVPR 2024国际挑战赛6月1日截止报名！ - 新鲜讯息

新赛题

七大赛道，赛题新颖，全方位覆盖相关领域最新最热话题，充分挖掘大模型在自动驾驶及具身智能垂直领域中的应用。

高奖金

总奖金池超过12万美金，单赛道最高奖金可达2.7万美金。据不完全统计，在本届CVPR一百多个论坛中，奖金额度位列榜首。

重原创

加强基础研究探索，坚持四个面向，以原创性与科学研究价值作为参赛主要衡量指标，并不单靠成绩排名，采取原创方案加性能指标两者结合的方式进行综合排序。

2024年3月1号，CVPR 2024 国际挑战赛正式启动。本次挑战赛由上海人工智能实验室主办，并联合多家国内外机构共同举办。多位国内外知名专家学者组成赛事指导与评奖委员会。本次比赛共设七个赛道，获胜者有机会获得高达两万七千美金奖励，还有机会受邀在国际顶级期刊投稿。我们还为每个赛道准备了详细的参赛指引及基准模型，点击每个赛道对应链接即可访问。

比赛官网：

https://opendrivelab.com/challenge2024

主活动：

CVPR 2024论坛 - Workshop on Foundation Models for Autonomous Systems (Seattle, USA)

相关活动：

四月下旬：

第三届中国三维视觉大会（China3DV 2024）
http://www.csig3dv.net/2024/competition.html

六月中旬：线下活动（北京/上海）

赛题介绍

端到端自动驾驶

由于先前数据集规模有限、开环和闭环指标不一致等原因，导致难以使用真实数据对感知运动驱动策略进行基准测试。此赛道将使用大规模数据弥合两种评估范式之间的差距，并通过在短时序范围内的BEV抽象建模，实现高效开环评测，同时更好地与闭环评估保持一致。

赛道信息：

https://opendrivelab.com/challenge2024/#end_to_end_driving_at_scale

数据量：

约2T

测试服务器：

https://huggingface.co/spaces/AGC2024-P/e2e-driving-2024

世界模型

作为现实的抽象时空表征，世界模型可根据观测到的当前状态预测未来状态，对世界模型的学习将促进基础模型性能提升至新水平。模型需要在只有视觉输入的情况下，预测出未来时刻的点云，以证明其对世界的预测能力。

赛道信息：

https://opendrivelab.com/challenge2024/#predictive_world_model

数据量：

约2T

参考训练时间：

样本数据8卡A100，3天

测试服务器：

https://huggingface.co/spaces/AGC2024-P/predictive-world-model-2024

占据栅格和运动估计

三维框往往不足以描述一般物体，受机器人学概念的启发，可将感知表征描述成对栅格化三维空间的占据情况预测。在这个赛道中，参赛者不仅要给出三维空间的栅格化表示，还须给出栅格的运动预测。

赛道信息：

https://opendrivelab.com/challenge2024/#occupancy_and_flow

自动驾驶挑战赛@China3DV ：

https://huggingface.co/spaces/China3DV-S/occupancy-and-flow-2024

数据量：

约70GB

参考训练时间：

8卡 3090，2天

测试服务器：

https://huggingface.co/spaces/AGC2024-S/occupancy-and-flow-2024

具身多模态三维视觉定位

相比驾驶场景，室内的具身三维感知系统面对的是包含语言指令的多模态输入、更复杂的语义理解、更多样的物体类别和朝向，以及大不相同的感知空间和需求。基于此，大赛构造了一套第一视角的多模态全场景三维感知工具包 EmbodiedScan。这项任务的目标是，给定关于特定物体的语言描述，检测出目标物体的类别以及带朝向的三维框。

赛道信息：

https://opendrivelab.com/challenge2024/#multiview_3d_visual_grounding

数据量：

约1.5T，比赛直接相关数据约 300G

参考训练时间：

参考训练时间：样本数据 4卡 A100 0.5天，全量数据 8卡 A100 1.5天

测试服务器：https://huggingface.co/spaces/AGC2024/visual-grounding-2024

CARLA自动驾驶挑战赛

CARLA自动驾驶挑战要求车辆通过一组预先定义的路线。车辆行驶路线中涉及复杂的情况，如高速公路、城区、住宅区和乡村等环境，同时包含日光、日落、夜晚以及雨、雾等光照和天气变量，为自动驾驶系统的闭环评测提供了可能。

赛道信息：https://opendrivelab.com/challenge2024/#carla

测试服务器：https://eval.ai/web/challenges/challenge-page/2098/overview

大语言模型在自动驾驶中的应用

通过引入语言信息，DriveLM数据集将大语言模型与自动驾驶系统连接起来，并最终通过引入语言的推理能力做出决策，确保规划的可解释性。以多视角图像为输入信息，模型须回答涉及驾驶的多方面问题。

赛道信息：https://opendrivelab.com/challenge2024/#driving_with_language

数据量：

训练集4072帧，测试集799帧，每帧约90个问答对

参考训练时间：

8卡V100，1天

测试服务器：

https://huggingface.co/spaces/AGC2024/driving-with-language-2024

无图驾驶

在没有高精地图的情况下，自动驾驶汽车需要高水平的场景理解能力，本赛道旨在探索场景推理能力的极限。将多视角图像和标清地图作为输入信息，神经网络不仅要输出车道和交通元素的感知结果，同时还须输出车道之间、车道和交通元素之间的拓扑关系。

赛道信息：

https://opendrivelab.com/challenge2024/#mapless_driving

自动驾驶挑战赛@China3DV ：

https://huggingface.co/spaces/China3DV/mapless-driving-2024

数据量：

约200G

参考训练时间：

8卡V100，1天

测试服务器：

https://huggingface.co/spaces/AGC2024/mapless-driving-2024

赛程安排

以下时间均为北京时间，详情请参照大赛官方网站

2024年3月1日

参赛报名

2024年3月1日

比赛正式开始

2024年3月25日

测试服务器开放

2024年6月1日

测试服务器关闭

2024年6月18日

比赛结果公布

指导与评奖委员会

＊按照姓名笔画排序；名单持续更新中。
乔宇	上海人工智能实验室	领军科学家，主任助理
刘青山	南京邮电大学	副校长
杨小康	上海交通大学	人工智能研究院执行院长
李升波	清华大学	车辆学院党委书记，国家高层次领军人才，教授
张亚勤	清华大学	中国工程院外籍院士，智能产业研究院院长，讲席教授
陈宝权	北京大学	智能学院副院长，博雅特聘教授
夏华夏	美团	首席科学家，副总裁
高新波	重庆邮电大学	党委副书记，校长，教授
薛建儒	西安交通大学	人工智能与机器人研究所教授
_