TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Audio Super-Resolution	Piano	U-Net	Log-Spectral Distance	3.4	# 3
Audio Super-Resolution	VCTK Multi-Speaker	U-Net	Log-Spectral Distance	3.1	# 7
Audio Super-Resolution	Voice Bank corpus (VCTK)	U-Net	Log-Spectral Distance	3.2	# 3

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/audio-super-resolution-using-neural-networks/audio-super-resolution-on-piano-1)](https://paperswithcode.com/sota/audio-super-resolution-on-piano-1?p=audio-super-resolution-using-neural-networks)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/audio-super-resolution-using-neural-networks/audio-super-resolution-on-voice-bank-corpus-1)](https://paperswithcode.com/sota/audio-super-resolution-on-voice-bank-corpus-1?p=audio-super-resolution-using-neural-networks)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/audio-super-resolution-using-neural-networks/audio-super-resolution-on-vctk-multi-speaker-1)](https://paperswithcode.com/sota/audio-super-resolution-on-vctk-multi-speaker-1?p=audio-super-resolution-using-neural-networks)`

Audio Super Resolution using Neural Networks

2 Aug 2017 · Volodymyr Kuleshov, S. Zayd Enam, Stefano Ermon ·

We introduce a new audio processing technique that increases the sampling rate of signals such as speech or music using deep convolutional neural networks. Our model is trained on pairs of low and high-quality audio examples; at test-time, it predicts missing samples within a low-resolution signal in an interpolation process similar to image super-resolution. Our method is simple and does not involve specialized audio processing techniques; in our experiments, it outperforms baselines on standard speech and music benchmarks at upscaling ratios of 2x, 4x, and 6x. The method has practical applications in telephony, compression, and text-to-speech generation; it demonstrates the effectiveness of feed-forward convolutional architectures on an audio generation task.

PDF Abstract

Code

Add Remove Mark official

kuleshov/audio-super-res

1,094

TrizteX/Audio-SuperRes

johnathanchiu/audio-upsampling

Amuzak-NTL/ASR-for-Speech-Recog

Tasks

Add Remove

Audio Generation

Audio Super-Resolution

Super-Resolution

Datasets

VCTK

Results from the Paper

Edit

Ranked #3 on Audio Super-Resolution on Voice Bank corpus (VCTK) (using extra training data)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Audio Super-Resolution	Piano	U-Net	Log-Spectral Distance	3.4	# 3	Compare
Audio Super-Resolution	VCTK Multi-Speaker	U-Net	Log-Spectral Distance	3.1	# 7	Compare
Audio Super-Resolution	Voice Bank corpus (VCTK)	U-Net	Log-Spectral Distance	3.2	# 3	Compare

Methods

Add Remove

1D CNN

Edit Social Preview

Audio Super Resolution using Neural Networks

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove