Visual Question Answering (VQA)

Introduced by Agrawal et al. in VQA: Visual Question Answering

Visual Question Answering (VQA) is a dataset containing open-ended questions about images. These questions require an understanding of vision, language and commonsense knowledge to answer. The first version of the dataset was released in October 2015. VQA v2.0 was released in April 2017.

Homepage

Benchmarks

Add a new result Link an existing benchmark

No benchmarks yet. Start a new benchmark or link an existing one.

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

facebookresearch/ParlAI

10,425

Tasks

Similar Datasets

OK-VQA

Visual Question Answering v2.0

Visual Question Answering (VQA)

Benchmarks

Add a new result Link an existing benchmark

Papers

Dataset Loaders

Add Remove

Tasks

Similar Datasets

OK-VQA

Visual Question Answering v2.0

GQA

Visual Genome

Usage

License

Modalities

Languages

Visual Question Answering (VQA)

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Similar Datasets

OK-VQA

Visual Question Answering v2.0

GQA

Visual Genome

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages