活动描述
ALFRED Challenge 自 CVPR 2020 Embodied AI Workshop 起成为固定 challenge track,基于 ALFRED 数据集在 AI2-THOR 中评测 language-guided 长时程交互。参赛者提交模型至 evaluation server,在 hidden test 上报告 unseen goal / unseen scene 指标。
与 ALFRED benchmark 条目关系:benchmark 为持续数据集;本条目强调 CVPR 年度 challenge 节奏与 leaderboard 冻结。是 embodied language agent 的「赛季制」观测窗口。
影响力证据
- 多届 CVPR EAI 官方 challenge
- EvalAI / 官方 server 长期运行
- 与 Habitat Challenge 并列 EAI 两大 challenge
行业价值
| 维度 | 分析 |
|---|---|
| 技术筛子 | 赛季制 language interaction 评测 |
| 公共底座 | 与 ALFRED 数据集一体 |
| 生态接口 | CVPR EAI 社区 |
| 场景窗口 | 室内家务仿真 |
前提与边界
- 主测大脑 grounding 与规划
跟踪建议
值得跟踪——CVPR 具身 challenge 固定赛道。