Search Results for author: Murali Karthick Baskar

Found 12 papers, 1 papers with code

O-1: Self-training with Oracle and 1-best Hypothesis

no code implementations • 14 Aug 2023 • Murali Karthick Baskar, Andrew Rosenberg, Bhuvana Ramabhadran, Kartik Audhkhasi

O-1 achieves 13\% to 25\% relative improvement over EMBR on the various datasets that SpeechStew comprises of, and a 12\% relative gap reduction with respect to the oracle WER over EMBR training on the in-house dataset.

speech-recognition Speech Recognition

Paper
Add Code

Robust Knowledge Distillation from RNN-T Models With Noisy Training Labels Using Full-Sum Loss

no code implementations • 10 Mar 2023 • Mohammad Zeineldeen, Kartik Audhkhasi, Murali Karthick Baskar, Bhuvana Ramabhadran

Soft distillation is another popular KD method that distills the output logits of the teacher model.

Knowledge Distillation

Paper
Add Code

Speaker adaptation for Wav2vec2 based dysarthric ASR

no code implementations • 2 Apr 2022 • Murali Karthick Baskar, Tim Herzig, Diana Nguyen, Mireia Diez, Tim Polzehl, Lukáš Burget, Jan "Honza'' Černocký

Speaker adaptation using fMLLR and xvectors have provided major gains for dysarthric speech with very little adaptation data.

speech-recognition Speech Recognition

Paper
Add Code

Ask2Mask: Guided Data Selection for Masked Speech Modeling

no code implementations • 24 Feb 2022 • Murali Karthick Baskar, Andrew Rosenberg, Bhuvana Ramabhadran, Yu Zhang, Pedro Moreno

They treat all unsupervised speech samples with equal weight, which hinders learning as not all samples have relevant information to learn meaningful representations.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +1

Paper
Add Code

EAT: Enhanced ASR-TTS for Self-supervised Speech Recognition

1 code implementation • 13 Apr 2021 • Murali Karthick Baskar, Lukáš Burget, Shinji Watanabe, Ramon Fernandez Astudillo, Jan "Honza'' Černocký

Self-supervised ASR-TTS models suffer in out-of-domain data conditions.

Language Modelling speech-recognition +1

Paper
Code

BUT Opensat 2019 Speech Recognition System

no code implementations • 30 Jan 2020 • Martin Karafiát, Murali Karthick Baskar, Igor Szöke, Hari Krishna Vydana, Karel Veselý, Jan "Honza'' Černocký

The paper describes the BUT Automatic Speech Recognition (ASR) systems submitted for OpenSAT evaluations under two domain categories such as low resourced languages and public safety communications.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +2

Paper
Add Code

Semi-supervised Sequence-to-sequence ASR using Unpaired Speech and Text

no code implementations • 30 Apr 2019 • Murali Karthick Baskar, Shinji Watanabe, Ramon Astudillo, Takaaki Hori, Lukáš Burget, Jan Černocký

Such techniques derive training procedures and losses able to leverage unpaired speech and/or text data by combining ASR with Text-to-Speech (TTS) models.

Ranked #33 on Semi-Supervised Image Classification on ImageNet - 10% labeled data (Top 5 Accuracy metric)

Automatic Speech Recognition Automatic Speech Recognition (ASR) +2

Paper
Add Code

Analysis of Multilingual Sequence-to-Sequence speech recognition systems

no code implementations • 7 Nov 2018 • Martin Karafiát, Murali Karthick Baskar, Shinji Watanabe, Takaaki Hori, Matthew Wiesner, Jan "Honza'' Černocký

This paper investigates the applications of various multilingual approaches developed in conventional hidden Markov model (HMM) systems to sequence-to-sequence (seq2seq) automatic speech recognition (ASR).

Automatic Speech Recognition Automatic Speech Recognition (ASR) +3

Paper
Add Code

Promising Accurate Prefix Boosting for sequence-to-sequence ASR

no code implementations • 7 Nov 2018 • Murali Karthick Baskar, Lukáš Burget, Shinji Watanabe, Martin Karafiát, Takaaki Hori, Jan Honza Černocký

In this paper, we present promising accurate prefix boosting (PAPB), a discriminative training technique for attention based sequence-to-sequence (seq2seq) ASR.

Paper
Add Code

Transfer learning of language-independent end-to-end ASR with language model fusion

no code implementations • 6 Nov 2018 • Hirofumi Inaguma, Jaejin Cho, Murali Karthick Baskar, Tatsuya Kawahara, Shinji Watanabe

This work explores better adaptation methods to low-resource languages using an external language model (LM) under the framework of transfer learning.

Language Modelling Transfer Learning

Paper
Add Code

Multilingual sequence-to-sequence speech recognition: architecture, transfer learning, and language modeling

no code implementations • 4 Oct 2018 • Jaejin Cho, Murali Karthick Baskar, Ruizhi Li, Matthew Wiesner, Sri Harish Mallidi, Nelson Yalta, Martin Karafiat, Shinji Watanabe, Takaaki Hori

In this work, we attempt to use data from 10 BABEL languages to build a multi-lingual seq2seq model as a prior model, and then port them towards 4 other BABEL languages using transfer learning approach.

Language Modelling Sequence-To-Sequence Speech Recognition +2

Paper
Add Code

Residual Memory Networks: Feed-forward approach to learn long temporal dependencies

no code implementations • 6 Aug 2018 • Murali Karthick Baskar, Martin Karafiat, Lukas Burget, Karel Vesely, Frantisek Grezl, Jan Honza Cernocky

In this paper we propose a residual memory neural network (RMN) architecture to model short-time dependencies using deep feed-forward layers having residual and time delayed connections.

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.