Search Results for author: Kyu Han

Found 4 papers, 2 papers with code

Wav2Seq: Pre-training Speech-to-Text Encoder-Decoder Models Using Pseudo Languages

1 code implementation • 2 May 2022 • Felix Wu, Kwangyoun Kim, Shinji Watanabe, Kyu Han, Ryan Mcdonald, Kilian Q. Weinberger, Yoav Artzi

We introduce Wav2Seq, the first self-supervised approach to pre-train both parts of encoder-decoder models for speech data.

Ranked #3 on Named Entity Recognition (NER) on SLUE

Automatic Speech Recognition Automatic Speech Recognition (ASR) +6

Paper
Code

SRU++: Pioneering Fast Recurrence with Attention for Speech Recognition

no code implementations • 11 Oct 2021 • Jing Pan, Tao Lei, Kwangyoun Kim, Kyu Han, Shinji Watanabe

The Transformer architecture has been well adopted as a dominant architecture in most sequence transduction tasks including automatic speech recognition (ASR), since its attention mechanism excels in capturing long-range dependencies.

Automatic Speech Recognition Automatic Speech Recognition (ASR) +4

Paper
Add Code

Performance-Efficiency Trade-offs in Unsupervised Pre-training for Speech Recognition

1 code implementation • 14 Sep 2021 • Felix Wu, Kwangyoun Kim, Jing Pan, Kyu Han, Kilian Q. Weinberger, Yoav Artzi

This paper is a study of performance-efficiency trade-offs in pre-trained models for automatic speech recognition (ASR).

Automatic Speech Recognition Automatic Speech Recognition (ASR) +2

Paper
Code

Speaker Diarization With Lexical Information

no code implementations • 27 Nov 2018 • Tae Jin Park, Kyu Han, Ian Lane, Panayiotis Georgiou

This work presents a novel approach to leverage lexical information for speaker diarization.

Clustering speaker-diarization +1

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.