TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Audio Source Separation	AudioSet	Co-Separation	SAR	13	# 1
Audio Source Separation	AudioSet	Co-Separation	SDR	4.26	# 2
Audio Source Separation	AudioSet	Co-Separation	SIR	7.07	# 1
Audio Denoising	AV-Bench - Guitar Solo	Co-Separation	NSDR	11.9	# 1
Audio Denoising	AV-Bench - Violin Yanni	Co-Separation	NSDR	8.53	# 1
Audio Denoising	AV-Bench - Wooden Horse	Co-Separation	NSDR	14.5	# 1
Audio Source Separation	MUSIC (multi-source)	Co-Separation	SAR	11.3	# 1
Audio Source Separation	MUSIC (multi-source)	Co-Separation	SIR	13.8	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/co-separating-sounds-of-visual-objects/audio-denoising-on-av-bench-guitar-solo)](https://paperswithcode.com/sota/audio-denoising-on-av-bench-guitar-solo?p=co-separating-sounds-of-visual-objects)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/co-separating-sounds-of-visual-objects/audio-denoising-on-av-bench-violin-yanni)](https://paperswithcode.com/sota/audio-denoising-on-av-bench-violin-yanni?p=co-separating-sounds-of-visual-objects)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/co-separating-sounds-of-visual-objects/audio-denoising-on-av-bench-wooden-horse)](https://paperswithcode.com/sota/audio-denoising-on-av-bench-wooden-horse?p=co-separating-sounds-of-visual-objects)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/co-separating-sounds-of-visual-objects/audio-source-separation-on-music-multi-source)](https://paperswithcode.com/sota/audio-source-separation-on-music-multi-source?p=co-separating-sounds-of-visual-objects)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/co-separating-sounds-of-visual-objects/audio-source-separation-on-audioset)](https://paperswithcode.com/sota/audio-source-separation-on-audioset?p=co-separating-sounds-of-visual-objects)`

Co-Separating Sounds of Visual Objects

ICCV 2019 · Ruohan Gao, Kristen Grauman ·

Learning how objects sound from video is challenging, since they often heavily overlap in a single audio channel. Current methods for visually-guided audio source separation sidestep the issue by training with artificially mixed video clips, but this puts unwieldy restrictions on training data collection and may even prevent learning the properties of "true" mixed sounds. We introduce a co-separation training paradigm that permits learning object-level sounds from unlabeled multi-source videos. Our novel training objective requires that the deep neural network's separated audio for similar-looking objects be consistently identifiable, while simultaneously reproducing accurate video-level audio tracks for each source training pair. Our approach disentangles sounds in realistic test videos, even in cases where an object was not observed individually during training. We obtain state-of-the-art results on visually-guided audio source separation and audio denoising for the MUSIC, AudioSet, and AV-Bench datasets.

PDF Abstract ICCV 2019 PDF ICCV 2019 Abstract

Code

Add Remove Mark official

rhgao/co-separation

manhnguyen1998/co_separation_encode…

YashNita/Co-Separating-Sound-Object-

Tasks

Add Remove

Audio Denoising

Audio Source Separation

Denoising

Datasets

AudioSet

Results from the Paper

Edit

Ranked #1 on Audio Denoising on AV-Bench - Wooden Horse

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Audio Source Separation	AudioSet	Co-Separation	SAR	13	# 1	Compare
			SDR	4.26	# 2	Compare
			SIR	7.07	# 1	Compare
Audio Denoising	AV-Bench - Guitar Solo	Co-Separation	NSDR	11.9	# 1	Compare
Audio Denoising	AV-Bench - Violin Yanni	Co-Separation	NSDR	8.53	# 1	Compare
Audio Denoising	AV-Bench - Wooden Horse	Co-Separation	NSDR	14.5	# 1	Compare
Audio Source Separation	MUSIC (multi-source)	Co-Separation	SAR	11.3	# 1	Compare
Audio Source Separation	MUSIC (multi-source)	Co-Separation	SIR	13.8	# 1	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Co-Separating Sounds of Visual Objects

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove