CALVIN (Composing Actions from Language and Vision)

Introduced by Mees et al. in CALVIN: A Benchmark for Language-Conditioned Policy Learning for Long-Horizon Robot Manipulation Tasks

CALVIN (Composing Actions from Language and Vision), is an open-source simulated benchmark to learn long-horizon language-conditioned robot manipulation tasks.

Homepage

Benchmarks

Add a new result Link an existing benchmark

Task	Dataset Variant	Best Model
Zero-shot Generalization	CALVIN	3D Diffuser Actor
Success Rate (5 task-horizon)	CALVIN	HULC++
Avg. sequence length	CALVIN	HULC++

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

mees/calvin

269

Tasks

Success Rate (5 task-horizon)
Avg. sequence length
Zero-shot Generalization

CALVIN (Composing Actions from Language and Vision)

Benchmarks

Add a new result Link an existing benchmark

Papers

Dataset Loaders

Add Remove

Tasks

Similar Datasets

Omnipush

DexHand

Usage

License

Modalities

Languages

CALVIN (Composing Actions from Language and Vision)

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Similar Datasets

Omnipush

DexHand

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages