← 返回列表

CALVIN

CALVIN

【收录说明:非独立赛事】CALVIN 是 IEEE RA-L 2022 Best Paper 发布的语言条件长时程桌面操作 benchmark,提供仿真、数据与评测协议,社区复现对比价值高,故纳入参考库。

类别
Benchmark / 评测基准
等级
A 级 · 技术筛子
影响力
状态
进行中
技术
大脑 · 小脑
形式
仿真
范围
全球
属地
线上 / 无固定属地
周期
持续
主办方
学术机构
主办
Oier Mees 等 / University of Freiburg、NVIDIA 等 CALVIN 社区

活动描述

CALVIN(Composing Actions from Language and Vision)是 2022 年 IEEE RA-L Best Paper Award 论文发布的开源仿真 benchmark它不是 RoboCup、Habitat Challenge 这类有报名与赛季制的竞技活动;本条收录是因为其在语言条件长时程操作领域引用广泛、评测协议清晰,对跟踪 VLA 与 language-conditioned policy 仍有参考意义。

智能体在 PyBullet 仿真中根据连续自然语言指令,完成开关抽屉、推块、转灯等 34 类基础技能 的组合任务,强调对未见语言与未见环境的泛化。社区在各自实验中报告 success chain length 等指标,无统一官方赛季。

影响力证据

行业价值

维度分析
技术筛子定义 language-conditioned long-horizon manipulation
公共底座开源仿真 + 演示 + 评测脚本
生态接口连接 NLP、VLA、机器人学习
场景窗口桌面家务抽象,非真机

前提与边界

跟踪建议

值得跟踪——关注论文引用与仓库更新;若需会中 challenge track,见 ALFRED Challenge @ CVPR EAI 等 workshop 条目。