Search Results for author: Ewald van der Westhuizen

Found 12 papers, 1 papers with code

Building a Unified Code-Switching ASR System for South African Languages

no code implementations • 28 Jul 2018 • Emre Yilmaz, Astik Biswas, Ewald van der Westhuizen, Febe De Wet, Thomas Niesler

We present our first efforts towards building a single multilingual automatic speech recognition (ASR) system that can process code-switching (CS) speech in five languages spoken within the same population.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +1

Paper
Add Code

A First South African Corpus of Multilingual Code-switched Soap Opera Speech

no code implementations • LREC 2018 • Ewald van der Westhuizen, Thomas Niesler

Language Modelling

Paper
Add Code

Unsupervised acoustic unit discovery for speech synthesis using discrete latent-variable neural networks

no code implementations • 16 Apr 2019 • Ryan Eloff, André Nortje, Benjamin van Niekerk, Avashna Govender, Leanne Nortje, Arnu Pretorius, Elan van Biljon, Ewald van der Westhuizen, Lisa van Staden, Herman Kamper

For our submission to the ZeroSpeech 2019 challenge, we apply discrete latent-variable neural networks to unlabelled speech and use the discovered units for speech synthesis.

Acoustic Unit Discovery Speech Synthesis

Paper
Add Code

Semi-supervised acoustic model training for five-lingual code-switched ASR

no code implementations • 20 Jun 2019 • Astik Biswas, Emre Yilmaz, Febe De Wet, Ewald van der Westhuizen, Thomas Niesler

Furthermore, because English is common to all language pairs in our data, it dominates when training a unified language model, leading to improved English ASR performance at the expense of the other languages.

Acoustic Modelling Language Modelling

Paper
Add Code

Improved low-resource Somali speech recognition by semi-supervised acoustic and language model training

no code implementations • 6 Jul 2019 • Astik Biswas, Raghav Menon, Ewald van der Westhuizen, Thomas Niesler

The automatic transcriptions from the best performing pass were used for language model augmentation.

Acoustic Modelling Automatic Speech Recognition +5

Paper
Add Code

Feature exploration for almost zero-resource ASR-free keyword spotting using a multilingual bottleneck extractor and correspondence autoencoders

no code implementations • 14 Nov 2018 • Raghav Menon, Herman Kamper, Ewald van der Westhuizen, John Quinn, Thomas Niesler

We compare features for dynamic time warping (DTW) when used to bootstrap keyword spotting (KWS) in an almost zero-resource setting.

Dynamic Time Warping Humanitarian +1

Paper
Add Code

Semi-supervised Development of ASR Systems for Multilingual Code-switched Speech in Under-resourced Languages

no code implementations • LREC 2020 • Astik Biswas, Emre Yilmaz, Febe De Wet, Ewald van der Westhuizen, Thomas Niesler

This paper reports on the semi-supervised development of acoustic and language models for under-resourced, code-switched speech in five South African languages.

Paper
Add Code

Semi-supervised acoustic and language model training for English-isiZulu code-switched speech recognition

no code implementations • LREC 2020 • Astik Biswas, Febe De Wet, Ewald van der Westhuizen, Thomas Niesler

We present an analysis of semi-supervised acoustic and language model training for English-isiZulu code-switched (CS) ASR using soap opera speech.

Language Modelling speech-recognition +1

Paper
Add Code

Semi-supervised Acoustic Modelling for Five-lingual Code-switched ASR using Automatically-segmented Soap Opera Speech

no code implementations • LREC 2020 • Nick Wilkinson, Astik Biswas, Emre Yilmaz, Febe De Wet, Ewald van der Westhuizen, Thomas Niesler

Automatic segmentation was applied in combination with automaticspeaker diarization.

Acoustic Modelling Action Detection +4

Paper
Add Code

Multilingual Bottleneck Features for Improving ASR Performance of Code-Switched Speech in Under-Resourced Languages

1 code implementation • 31 Oct 2020 • Trideba Padhi, Astik Biswas, Febe De Wet, Ewald van der Westhuizen, Thomas Niesler

In this work, we explore the benefits of using multilingual bottleneck features (mBNF) in acoustic modelling for the automatic speech recognition of code-switched (CS) speech in African languages.

Acoustic Modelling Automatic Speech Recognition +2

Paper
Code

Feature learning for efficient ASR-free keyword spotting in low-resource languages

no code implementations • 13 Aug 2021 • Ewald van der Westhuizen, Herman Kamper, Raghav Menon, John Quinn, Thomas Niesler

We show that, using these features, the CNN-DTW keyword spotter performs almost as well as the DTW keyword spotter while outperforming a baseline CNN trained only on the keyword templates.

Dynamic Time Warping Humanitarian +1

Paper
Add Code

Multilingual training set selection for ASR in under-resourced Malian languages

no code implementations • 13 Aug 2021 • Ewald van der Westhuizen, Trideba Padhi, Thomas Niesler

We find that, although maximising the training pool by including all six additional languages provides improved speech recognition in both target languages, substantially better performance can be achieved by a more judicious choice.

Humanitarian speech-recognition +1

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.