Search Results for author: Edresson Casanova

Found 14 papers, 9 papers with code

Deep Learning against COVID-19: Respiratory Insufficiency Detection in Brazilian Portuguese Speech

no code implementations • Findings (ACL) 2021 • Edresson Casanova, Lucas Gris, Augusto Camargo, Daniel da Silva, Murilo Gazzola, Ester Sabino, Anna Levin, Arnaldo Candido Jr, Sandra Aluisio, Marcelo Finger

Paper
Add Code

CML-TTS A Multilingual Dataset for Speech Synthesis in Low-Resource Languages

no code implementations • 16 Jun 2023 • Frederico S. Oliveira, Edresson Casanova, Arnaldo Cândido Júnior, Anderson S. Soares, Arlindo R. Galvão Filho

In this paper, we present CML-TTS, a recursive acronym for CML-Multi-Lingual-TTS, a new Text-to-Speech (TTS) dataset developed at the Center of Excellence in Artificial Intelligence (CEIA) of the Federal University of Goias (UFG).

Speech Synthesis

Paper
Add Code

Evaluation of Speech Representations for MOS prediction

1 code implementation • 16 Jun 2023 • Frederico S. Oliveira, Edresson Casanova, Arnaldo Cândido Júnior, Lucas R. S. Gris, Anderson S. Soares, Arlindo R. Galvão Filho

Among the supervised and self-supervised learning models using BRSpeechMOS, Whisper-Small achieved the best linear correlation of 0. 6980, and the speaker verification model, SpeakerNet, had linear correlation of 0. 6963.

Self-Supervised Learning Speaker Verification

Paper
Code

Evaluating OpenAI's Whisper ASR for Punctuation Prediction and Topic Modeling of life histories of the Museum of the Person

no code implementations • 23 May 2023 • Lucas Rafael Stefanel Gris, Ricardo Marcacini, Arnaldo Candido Junior, Edresson Casanova, Anderson Soares, Sandra Maria Aluísio

Automatic speech recognition (ASR) systems play a key role in applications involving human-machine interactions.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +1

Paper
Add Code

Interpretability Analysis of Deep Models for COVID-19 Detection

no code implementations • 25 Nov 2022 • Daniel Peixoto Pinto da Silva, Edresson Casanova, Lucas Rafael Stefanel Gris, Arnaldo Candido Junior, Marcelo Finger, Flaviane Svartman, Beatriz Raposo, Marcus Vinícius Moreira Martins, Sandra Maria Aluísio, Larissa Cristina Berti, João Paulo Teixeira

During the outbreak of COVID-19 pandemic, several research areas joined efforts to mitigate the damages caused by SARS-CoV-2.

Paper
Add Code

BibleTTS: a large, high-fidelity, multilingual, and uniquely African speech corpus

1 code implementation • 7 Jul 2022 • Josh Meyer, David Ifeoluwa Adelani, Edresson Casanova, Alp Öktem, Daniel Whitenack Julian Weber, Salomon Kabongo, Elizabeth Salesky, Iroro Orife, Colin Leong, Perez Ogayo, Chris Emezue, Jonathan Mukiibi, Salomey Osei, Apelete Agbolo, Victor Akinode, Bernard Opoku, Samuel Olanrewaju, Jesujoba Alabi, Shamsuddeen Muhammad

BibleTTS is a large, high-quality, open speech dataset for ten languages spoken in Sub-Saharan Africa.

Vocal Bursts Intensity Prediction

Paper
Code

ASR data augmentation in low-resource settings using cross-lingual multi-speaker TTS and cross-lingual voice conversion

1 code implementation • 29 Mar 2022 • Edresson Casanova, Christopher Shulby, Alexander Korolev, Arnaldo Candido Junior, Anderson da Silva Soares, Sandra Aluísio, Moacir Antonelli Ponti

We explore cross-lingual multi-speaker speech synthesis and cross-lingual voice conversion applied to data augmentation for automatic speech recognition (ASR) systems in low/medium-resource scenarios.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +4

Paper
Code

YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot Voice Conversion for everyone

3 code implementations • 4 Dec 2021 • Edresson Casanova, Julian Weber, Christopher Shulby, Arnaldo Candido Junior, Eren Gölge, Moacir Antonelli Ponti

YourTTS brings the power of a multilingual approach to the task of zero-shot multi-speaker TTS.

Speech Synthesis Voice Conversion +3

29,008

Paper
Code

CORAA: a large corpus of spontaneous and prepared speech manually validated for speech recognition in Brazilian Portuguese

2 code implementations • 14 Oct 2021 • Arnaldo Candido Junior, Edresson Casanova, Anderson Soares, Frederico Santos de Oliveira, Lucas Oliveira, Ricardo Corso Fernandes Junior, Daniel Peixoto Pinto da Silva, Fernando Gorgulho Fayet, Bruno Baldissera Carlotto, Lucas Rafael Stefanel Gris, Sandra Maria Aluísio

with 290. 77 hours, a publicly available dataset for ASR in BP containing validated pairs (audio-transcription).

Automatic Speech Recognition Automatic Speech Recognition (ASR) +1

Paper
Code

Brazilian Portuguese Speech Recognition Using Wav2vec 2.0

1 code implementation • 23 Jul 2021 • Lucas Rafael Stefanel Gris, Edresson Casanova, Frederico Santos de Oliveira, Anderson da Silva Soares, Arnaldo Candido Junior

In this sense, this work presents the development of an public Automatic Speech Recognition (ASR) system using only open available audio data, from the fine-tuning of the Wav2vec 2. 0 XLSR-53 model pre-trained in many languages, over BP data.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +3

Paper
Code

SC-GlowTTS: an Efficient Zero-Shot Multi-Speaker Text-To-Speech Model

2 code implementations • 2 Apr 2021 • Edresson Casanova, Christopher Shulby, Eren Gölge, Nicolas Michael Müller, Frederico Santos de Oliveira, Arnaldo Candido Junior, Anderson da Silva Soares, Sandra Maria Aluisio, Moacir Antonelli Ponti

In this paper, we propose SC-GlowTTS: an efficient zero-shot multi-speaker text-to-speech model that improves similarity for speakers unseen during training.

29,008

Paper
Code