CrowdSpeech

Introduced by Pavlichenko et al. in CrowdSpeech and VoxDIY: Benchmark Datasets for Crowdsourced Audio Transcription

CrowdSpeech is a publicly available large-scale dataset of crowdsourced audio transcriptions. It contains annotations for more than 20 hours of English speech from more than 1,000 crowd workers.

Homepage

Benchmarks

Add a new result Link an existing benchmark

Trend	Task	Dataset Variant	Best Model	Paper	Code
	Crowdsourced Text Aggregation	CrowdSpeech test-clean	ROVER
	Crowdsourced Text Aggregation	CrowdSpeech test-other	ROVER

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

huggingface/datasets

18,398

Tasks

Speech Recognition
Crowdsourced Text Aggregation

Usage

CrowdSpeech

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages