← 返回列表

ALFRED

ALFRED

ALFRED 是 AI2 2019–2020 发布的语言导航与交互 benchmark 与数据集(非独立举办的挑战赛);会中 ALFRED Challenge 见 workshop-track 条目。

类别
Benchmark / 评测基准
等级
A 级 · 技术筛子
影响力
状态
进行中
技术
大脑
形式
仿真
范围
全球
属地
线上 / 无固定属地
周期
持续
主办方
学术机构
主办
Allen Institute for AI / 学术社区

活动描述

ALFRED(Action Learning From Realistic Environments and Directives)在 AI2-THOR 仿真中定义 长时程语言引导家务任务:智能体需根据高层目标与逐步自然语言指令,完成 pick、heat、clean、examine 等交互。数据集含 25K+ 语言标注,强调部分可观测、不可逆动作与状态变化

自 CVPR 2020 Embodied AI Workshop 起成为固定 challenge;与 Habitat 导航、BEHAVIOR 操作形成互补。虽为 discrete action 设定,仍是 vision-language-navigation + interaction 的经典筛子。

影响力证据

行业价值

维度分析
技术筛子语言+视觉+长时程交互的标准问题
公共底座AI2-THOR 生态核心数据集之一
生态接口连接 CV、NLP、具身 AI
场景窗口室内家务抽象

前提与边界

跟踪建议

值得跟踪——language-guided embodied agent 的经典 benchmark。