TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
JPEG Decompression	ImageNet	Palette (QF: 5)	FID-5K	8.3	# 3
JPEG Decompression	ImageNet	Palette (QF: 5)	IS	133.6	# 4
JPEG Decompression	ImageNet	Palette (QF: 5)	CA	64.2	# 4
JPEG Decompression	ImageNet	Palette (QF: 5)	PD	95.5	# 4
JPEG Decompression	ImageNet	Palette (QF: 20)	FID-5K	4.3	# 1
JPEG Decompression	ImageNet	Palette (QF: 20)	IS	208.7	# 1
JPEG Decompression	ImageNet	Palette (QF: 20)	CA	73.5	# 1
JPEG Decompression	ImageNet	Palette (QF: 20)	PD	37.1	# 1
JPEG Decompression	ImageNet	Regression (QF: 20)	FID-5K	11.5	# 4
JPEG Decompression	ImageNet	Regression (QF: 20)	IS	158.7	# 3
JPEG Decompression	ImageNet	Regression (QF: 20)	CA	69.7	# 3
JPEG Decompression	ImageNet	Regression (QF: 20)	PD	65.4	# 3
JPEG Decompression	ImageNet	Palette (QF: 10)	FID-5K	5.4	# 2
JPEG Decompression	ImageNet	Palette (QF: 10)	IS	180.5	# 2
JPEG Decompression	ImageNet	Palette (QF: 10)	CA	70.7	# 2
JPEG Decompression	ImageNet	Palette (QF: 10)	PD	58.3	# 2
JPEG Decompression	ImageNet	Regression (QF: 10)	FID-5K	18.0	# 5
JPEG Decompression	ImageNet	Regression (QF: 10)	IS	117.2	# 5
JPEG Decompression	ImageNet	Regression (QF: 10)	CA	63.5	# 5
JPEG Decompression	ImageNet	Regression (QF: 10)	PD	102.2	# 5
JPEG Decompression	ImageNet	Regression (QF: 5)	FID-5K	29.0	# 6
JPEG Decompression	ImageNet	Regression (QF: 5)	IS	73.9	# 6
JPEG Decompression	ImageNet	Regression (QF: 5)	CA	52.8	# 6
JPEG Decompression	ImageNet	Regression (QF: 5)	PD	155.4	# 6
Colorization	ImageNet ctest10k	Palette	FID	3.4	# 1
Colorization	ImageNet val	Palette	FID-5K	15.78	# 1
Uncropping	Places2 val	Palette	FID	3.53	# 1
Uncropping	Places2 val	Palette	PD	103.3	# 1
Uncropping	Places2 val	Palette	Fool rate	39.9	# 1
Image Inpainting	Places2 val	Palatte (20-30% free form)	FID	11.7	# 1
Image Inpainting	Places2 val	Palatte (20-30% free form)	PD	35.0	# 1
Image Inpainting	Places2 val	Palette (128×128 center mask)	FID	11.9	# 2
Image Inpainting	Places2 val	Palette (128×128 center mask)	PD	57.3	# 2

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/palette-image-to-image-diffusion-models-1/jpeg-decompression-on-imagenet)](https://paperswithcode.com/sota/jpeg-decompression-on-imagenet?p=palette-image-to-image-diffusion-models-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/palette-image-to-image-diffusion-models-1/colorization-on-imagenet-ctest10k)](https://paperswithcode.com/sota/colorization-on-imagenet-ctest10k?p=palette-image-to-image-diffusion-models-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/palette-image-to-image-diffusion-models-1/colorization-on-imagenet-val)](https://paperswithcode.com/sota/colorization-on-imagenet-val?p=palette-image-to-image-diffusion-models-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/palette-image-to-image-diffusion-models-1/uncropping-on-places2-val)](https://paperswithcode.com/sota/uncropping-on-places2-val?p=palette-image-to-image-diffusion-models-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/palette-image-to-image-diffusion-models-1/image-inpainting-on-places2-val)](https://paperswithcode.com/sota/image-inpainting-on-places2-val?p=palette-image-to-image-diffusion-models-1)`

Palette: Image-to-Image Diffusion Models

10 Nov 2021 · Chitwan Saharia, William Chan, Huiwen Chang, Chris A. Lee, Jonathan Ho, Tim Salimans, David J. Fleet, Mohammad Norouzi ·

This paper develops a unified framework for image-to-image translation based on conditional diffusion models and evaluates this framework on four challenging image-to-image translation tasks, namely colorization, inpainting, uncropping, and JPEG restoration. Our simple implementation of image-to-image diffusion models outperforms strong GAN and regression baselines on all tasks, without task-specific hyper-parameter tuning, architecture customization, or any auxiliary loss or sophisticated new techniques needed. We uncover the impact of an L2 vs. L1 loss in the denoising diffusion objective on sample diversity, and demonstrate the importance of self-attention in the neural architecture through empirical studies. Importantly, we advocate a unified evaluation protocol based on ImageNet, with human evaluation and sample quality scores (FID, Inception Score, Classification Accuracy of a pre-trained ResNet-50, and Perceptual Distance against original images). We expect this standardized evaluation protocol to play a role in advancing image-to-image translation research. Finally, we show that a generalist, multi-task diffusion model performs as well or better than task-specific specialist counterparts. Check out https://diffusion-palette.github.io for an overview of the results.

PDF Abstract

Code

Add Remove Mark official

Janspiry/Palette-Image-to-Image-Dif…

↳ Quickstart in

Colab

1,377

LouisRouss/Diffusion-Based-Model-fo…

131

crosszamirski/guided-i2i

omerb01/puq

Tasks

Add Remove

Colorization

Denoising

Image-to-Image Translation

JPEG Decompression

Perceptual Distance

Translation

Uncropping

Datasets

ImageNet

Places

ImageNet ctest10k

Results from the Paper

Edit

Ranked #1 on Colorization on ImageNet ctest10k

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
JPEG Decompression	ImageNet	Palette (QF: 5)	FID-5K	8.3	# 3	Compare
			IS	133.6	# 4	Compare
			CA	64.2	# 4	Compare
			PD	95.5	# 4	Compare
JPEG Decompression	ImageNet	Palette (QF: 20)	FID-5K	4.3	# 1	Compare
			IS	208.7	# 1	Compare
			CA	73.5	# 1	Compare
			PD	37.1	# 1	Compare
JPEG Decompression	ImageNet	Regression (QF: 20)	FID-5K	11.5	# 4	Compare
			IS	158.7	# 3	Compare
			CA	69.7	# 3	Compare
			PD	65.4	# 3	Compare
JPEG Decompression	ImageNet	Palette (QF: 10)	FID-5K	5.4	# 2	Compare
			IS	180.5	# 2	Compare
			CA	70.7	# 2	Compare
			PD	58.3	# 2	Compare
JPEG Decompression	ImageNet	Regression (QF: 10)	FID-5K	18.0	# 5	Compare
			IS	117.2	# 5	Compare
			CA	63.5	# 5	Compare
			PD	102.2	# 5	Compare
JPEG Decompression	ImageNet	Regression (QF: 5)	FID-5K	29.0	# 6	Compare
			IS	73.9	# 6	Compare
			CA	52.8	# 6	Compare
			PD	155.4	# 6	Compare
Colorization	ImageNet ctest10k	Palette	FID	3.4	# 1	Compare
Colorization	ImageNet val	Palette	FID-5K	15.78	# 1	Compare
Uncropping	Places2 val	Palette	FID	3.53	# 1	Compare
			PD	103.3	# 1	Compare
			Fool rate	39.9	# 1	Compare
Image Inpainting	Places2 val	Palatte (20-30% free form)	FID	11.7	# 1	Compare
Image Inpainting	Places2 val	Palatte (20-30% free form)	PD	35.0	# 1	Compare
Image Inpainting	Places2 val	Palette (128×128 center mask)	FID	11.9	# 2	Compare
Image Inpainting	Places2 val	Palette (128×128 center mask)	PD	57.3	# 2	Compare

Methods

Add Remove

Diffusion

Edit Social Preview

Palette: Image-to-Image Diffusion Models

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove