1 dataset result for segmentation AND Action Recognition In Videos AND Videos

…AVA Speech densely annotates audio-based speech activity in AVA v1.0 videos, and explicitly labels 3 background noise conditions, resulting in ~46K labeled segments spanning 45 hours of data.

98 PAPERS • 7 BENCHMARKS

Datasets

1 dataset result for segmentation AND Action Recognition In Videos AND Videos