GigaSpeech

Introduced by Chen et al. in GigaSpeech: An Evolving, Multi-domain ASR Corpus with 10,000 Hours of Transcribed Audio

GigaSpeech, an evolving, multi-domain English speech recognition corpus with 10,000 hours of high quality labeled audio suitable for supervised training, and 40,000 hours of total audio suitable for semi-supervised and unsupervised training.

Homepage

Benchmarks

Add a new result Link an existing benchmark

Task	Dataset Variant	Best Model
Speech Recognition	GigaSpeech	Conformer/Transformer-AED
Speech Recognition	GigaSpeech DEV	Conformer/Transformer-AED
Speech Recognition	GigaSpeech TEST	Conformer/Transformer-AED