TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Speech-to-Speech Translation	TAT	Hokkien→En (Two-pass decoding)	ASR-BLEU (Dev)	13.6	# 1
Speech-to-Speech Translation	TAT	Hokkien→En (Two-pass decoding)	ASR-BLEU (Test)	12.5	# 1
Speech-to-Speech Translation	TAT	En→Hokkien (Single-pass decoding)	ASR-BLEU (Dev)	6.6	# 8
Speech-to-Speech Translation	TAT	En→Hokkien (Single-pass decoding)	ASR-BLEU (Test)	6.0	# 8
Speech-to-Speech Translation	TAT	En→Hokkien (Two-stage)	ASR-BLEU (Dev)	7.1	# 7
Speech-to-Speech Translation	TAT	En→Hokkien (Two-stage)	ASR-BLEU (Test)	6.6	# 7
Speech-to-Speech Translation	TAT	En→Hokkien (Three-stage)	ASR-BLEU (Dev)	7.5	# 6
Speech-to-Speech Translation	TAT	En→Hokkien (Three-stage)	ASR-BLEU (Test)	6.8	# 6
Speech-to-Speech Translation	TAT	En→Hokkien (Two-pass decoding)	ASR-BLEU (Dev)	7.8	# 5
Speech-to-Speech Translation	TAT	En→Hokkien (Two-pass decoding)	ASR-BLEU (Test)	7.3	# 5
Speech-to-Speech Translation	TAT	Hokkien→En (Single-pass decoding)	ASR-BLEU (Dev)	8.8	# 4
Speech-to-Speech Translation	TAT	Hokkien→En (Single-pass decoding)	ASR-BLEU (Test)	8.1	# 4
Speech-to-Speech Translation	TAT	Hokkien→En (Three-stage)	ASR-BLEU (Dev)	12.5	# 2
Speech-to-Speech Translation	TAT	Hokkien→En (Three-stage)	ASR-BLEU (Test)	8.8	# 3
Speech-to-Speech Translation	TAT	Hokkien→En (Two-stage)	ASR-BLEU (Dev)	12.5	# 2
Speech-to-Speech Translation	TAT	Hokkien→En (Two-stage)	ASR-BLEU (Test)	10.5	# 2

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/speech-to-speech-translation-for-a-real-world/speech-to-speech-translation-on-tat)](https://paperswithcode.com/sota/speech-to-speech-translation-on-tat?p=speech-to-speech-translation-for-a-real-world)`

Speech-to-speech translation for a real-world unwritten language

arXiv 2022 · Peng-Jen Chen, Kevin Tran, Yilin Yang, Jingfei Du, Justine Kao, Yu-An Chung, Paden Tomasello, Paul-Ambroise Duquenne, Holger Schwenk, Hongyu Gong, Hirofumi Inaguma, Sravya Popuri, Changhan Wang, Juan Pino, Wei-Ning Hsu, Ann Lee ·

We study speech-to-speech translation (S2ST) that translates speech from one language into another language and focuses on building systems to support languages without standard text writing systems. We use English-Taiwanese Hokkien as a case study, and present an end-to-end solution from training data collection, modeling choices to benchmark dataset release. First, we present efforts on creating human annotated data, automatically mining data from large unlabeled speech datasets, and adopting pseudo-labeling to produce weakly supervised data. On the modeling, we take advantage of recent advances in applying self-supervised discrete representations as target for prediction in S2ST and show the effectiveness of leveraging additional text supervision from Mandarin, a language similar to Hokkien, in model training. Finally, we release an S2ST benchmark set to facilitate future research in this field.

PDF Abstract

Code

Add Remove Mark official

facebookresearch/fairseq official

29,240

Tasks

Add Remove

Speech-to-Speech Translation

Translation

Datasets

LibriSpeech

MuST-C Libri-Light CCMatrix

WenetSpeech

TAT

Results from the Paper

Add Remove

Ranked #1 on Speech-to-Speech Translation on TAT (using extra training data)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Speech-to-Speech Translation	TAT	Hokkien→En (Two-pass decoding)	ASR-BLEU (Dev)	13.6	# 1	Compare
Speech-to-Speech Translation	TAT	Hokkien→En (Two-pass decoding)	ASR-BLEU (Test)	12.5	# 1	Compare
Speech-to-Speech Translation	TAT	En→Hokkien (Single-pass decoding)	ASR-BLEU (Dev)	6.6	# 8	Compare
Speech-to-Speech Translation	TAT	En→Hokkien (Single-pass decoding)	ASR-BLEU (Test)	6.0	# 8	Compare
Speech-to-Speech Translation	TAT	En→Hokkien (Two-stage)	ASR-BLEU (Dev)	7.1	# 7	Compare
Speech-to-Speech Translation	TAT	En→Hokkien (Two-stage)	ASR-BLEU (Test)	6.6	# 7	Compare
Speech-to-Speech Translation	TAT	En→Hokkien (Three-stage)	ASR-BLEU (Dev)	7.5	# 6	Compare
Speech-to-Speech Translation	TAT	En→Hokkien (Three-stage)	ASR-BLEU (Test)	6.8	# 6	Compare
Speech-to-Speech Translation	TAT	En→Hokkien (Two-pass decoding)	ASR-BLEU (Dev)	7.8	# 5	Compare
Speech-to-Speech Translation	TAT	En→Hokkien (Two-pass decoding)	ASR-BLEU (Test)	7.3	# 5	Compare
Speech-to-Speech Translation	TAT	Hokkien→En (Single-pass decoding)	ASR-BLEU (Dev)	8.8	# 4	Compare
Speech-to-Speech Translation	TAT	Hokkien→En (Single-pass decoding)	ASR-BLEU (Test)	8.1	# 4	Compare
Speech-to-Speech Translation	TAT	Hokkien→En (Three-stage)	ASR-BLEU (Dev)	12.5	# 2	Compare
Speech-to-Speech Translation	TAT	Hokkien→En (Three-stage)	ASR-BLEU (Test)	8.8	# 3	Compare
Speech-to-Speech Translation	TAT	Hokkien→En (Two-stage)	ASR-BLEU (Dev)	12.5	# 2	Compare
Speech-to-Speech Translation	TAT	Hokkien→En (Two-stage)	ASR-BLEU (Test)	10.5	# 2	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Speech-to-speech translation for a real-world unwritten language

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove