TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Speech Recognition	Common Voice German	Conformer Transducer (no LM)	Test WER	6.28%	# 6
Automatic Speech Recognition (ASR)	HUI speech corpus	Conformer Transducer	WER (%)	1.89%	# 1
Automatic Speech Recognition (ASR)	M-AILabs speech dataset	Conformer Transducer	WER (%)	4.28%	# 1
Automatic Speech Recognition (ASR)	The Spoken Wikipedia Corpora	Conformer Transducer	WER (%)	8.04%	# 1
Speech Recognition	TUDA	Conformer-Transducer (no LM)	Test WER	5.82%	# 1
Automatic Speech Recognition (ASR)	Voxforge German	Conformer Transducer	WER (%)	3.36%	# 1
Automatic Speech Recognition (ASR)	VoxPopuli	Conformer Transducer (German)	WER (%)	8.98%	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automatic-speech-recognition-in-german-a/automatic-speech-recognition-on-hui)](https://paperswithcode.com/sota/automatic-speech-recognition-on-hui?p=automatic-speech-recognition-in-german-a)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automatic-speech-recognition-in-german-a/automatic-speech-recognition-on-m-ailabs)](https://paperswithcode.com/sota/automatic-speech-recognition-on-m-ailabs?p=automatic-speech-recognition-in-german-a)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automatic-speech-recognition-in-german-a/automatic-speech-recognition-on-the-spoken)](https://paperswithcode.com/sota/automatic-speech-recognition-on-the-spoken?p=automatic-speech-recognition-in-german-a)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automatic-speech-recognition-in-german-a/speech-recognition-on-tuda)](https://paperswithcode.com/sota/speech-recognition-on-tuda?p=automatic-speech-recognition-in-german-a)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automatic-speech-recognition-in-german-a/automatic-speech-recognition-on-voxforge)](https://paperswithcode.com/sota/automatic-speech-recognition-on-voxforge?p=automatic-speech-recognition-in-german-a)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automatic-speech-recognition-in-german-a/automatic-speech-recognition-on-voxpopuli)](https://paperswithcode.com/sota/automatic-speech-recognition-on-voxpopuli?p=automatic-speech-recognition-in-german-a)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automatic-speech-recognition-in-german-a/speech-recognition-on-common-voice-german)](https://paperswithcode.com/sota/speech-recognition-on-common-voice-german?p=automatic-speech-recognition-in-german-a)`

Automatic Speech Recognition in German: A Detailed Error Analysis

IEEE International Conference on Omni-layer Intelligent Systems (COINS) 2022 · Johannes Wirth, René Peinl ·

The amount of freely available systems for automatic speech recognition (ASR) based on neural networks is growing steadily, with equally increasingly reliable predictions. However, the evaluation of trained models is typically exclusively based on statistical metrics such as WER or CER, which do not provide any insight into the nature or impact of the errors produced when predicting transcripts from speech input. This work presents a selection of ASR model architectures that are pretrained on the German language and evaluates them on a benchmark of diverse test datasets. It identifies cross-architectural prediction errors, classifies those into categories and traces the sources of errors per category back into training data as well as other sources. Finally, it discusses solutions in order to create qualitatively better training datasets and more robust ASR systems.

PDF Abstract

Code

Add Remove Mark official

No code implementations yet. Submit your code now

Tasks

Add Remove

Automatic Speech Recognition

Automatic Speech Recognition (ASR)

speech-recognition

Speech Recognition

Datasets

Common Voice VoxPopuli TUDA HUI speech corpus

The Spoken Wikipedia Corpora M-AILabs speech dataset Voxforge German

Results from the Paper

Add Remove

Ranked #1 on Automatic Speech Recognition (ASR) on VoxPopuli (using extra training data)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Speech Recognition	Common Voice German	Conformer Transducer (no LM)	Test WER	6.28%	# 6	Compare
Automatic Speech Recognition (ASR)	HUI speech corpus	Conformer Transducer	WER (%)	1.89%	# 1	Compare
Automatic Speech Recognition (ASR)	M-AILabs speech dataset	Conformer Transducer	WER (%)	4.28%	# 1	Compare
Automatic Speech Recognition (ASR)	The Spoken Wikipedia Corpora	Conformer Transducer	WER (%)	8.04%	# 1	Compare
Speech Recognition	TUDA	Conformer-Transducer (no LM)	Test WER	5.82%	# 1	Compare
Automatic Speech Recognition (ASR)	Voxforge German	Conformer Transducer	WER (%)	3.36%	# 1	Compare
Automatic Speech Recognition (ASR)	VoxPopuli	Conformer Transducer (German)	WER (%)	8.98%	# 1	Compare

Methods

Add Remove

Test

Edit Social Preview

Automatic Speech Recognition in German: A Detailed Error Analysis

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove