VOCASET

Introduced by Cudeiro et al. in Capture, Learning, and Synthesis of 3D Speaking Styles

VOCASET is a 4D face dataset with about 29 minutes of 4D scans captured at 60 fps and synchronized audio. The dataset has 12 subjects and 480 sequences of about 3-4 seconds each with sentences chosen from an array of standard protocols that maximize phonetic diversity.

Source: timzhang642

Homepage

Benchmarks

Add a new result Link an existing benchmark

Trend	Task	Dataset Variant	Best Model	Paper	Code
	3D Face Animation	VOCASET	MeshTalk

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

No data loaders found. You can submit your data loader here.

Tasks

3D Face Animation
Talking Face Generation

Similar Datasets

BEAT2

MEAD

Multiface

Biwi 3D Audiovisual Corpus of Affective Communication - B3D(AC)^2

VOCASET

Benchmarks

Add a new result Link an existing benchmark

Papers

Dataset Loaders

Add Remove

Tasks

Similar Datasets

BEAT2

MEAD

Multiface

Biwi 3D Audiovisual Corpus of Affective Communication - B3D(AC)^2

Usage

License

Modalities

Languages

VOCASET

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Similar Datasets

BEAT2

MEAD

Multiface

Biwi 3D Audiovisual Corpus of Affective Communication - B3D(AC)^2

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages