← 返回列表

BEHAVIOR Challenge

BEHAVIOR Challenge

BEHAVIOR Challenge 基于 BEHAVIOR-1K 高保真居家仿真,评测清洁、整理等长程家务任务,强调多步推理、物体交互与全身移动,是 household 具身 benchmark 代表。

类别
Benchmark / 评测基准
等级
A 级 · 技术筛子
影响力
状态
进行中
技术
大脑 · 小脑 · 本体
形式
仿真 · 打榜
范围
全球
属地
线上 / 无固定属地
周期
年度
主办方
学术机构
主办
Stanford Vision and Learning Lab / BEHAVIOR 社区

活动描述

BEHAVIOR Challenge 面向长程 household 任务:在高度逼真的交互式居家仿真(BEHAVIOR-1K)中,智能体需完成清洁、整理、烹饪等多步活动。评测强调活动理解、长程规划、affordance 推理与全身移动,而非单步 pick-place。

赛事通常与 Embodied AI Workshop 等顶会节点联动,采用异步代码提交 + 标准化场景集的方式,避免手工刷分。BEHAVIOR-1K 提供大量可交互物体与活动模板,降低 household benchmark 构建成本,推动 VLA 与 hierarchical planning 方法对比。

对研究者,该赛是**「大脑主导的长程任务」**代表;需注意仿真物理与真实家务 gap,应结合真机 small-scale 实验或 OXE 类数据集交叉验证。

影响力证据

行业价值

维度分析
技术筛子把「通用家务 agent」从 demo 拉入可量化 benchmark
公共底座场景、对象、活动 ontology 成为共享资产
生态接口吸引 manipulation + planning + VLA 多方同台
场景窗口贴近服务机器人/人形居家场景,但仍在 sim

前提与边界

跟踪建议

值得年度跟踪——长程具身任务 benchmark 的前沿代表。