TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Image Classification	CIFAR-10	Diffusion Classifier (zero-shot)	Percentage correct	88.5	# 198
Fine-Grained Image Classification	FGVC Aircraft	Diffusion Classifier (zero-shot)	Accuracy	26.4	# 52
Image Classification	Flowers-102	Diffusion Classifier (zero-shot)	Per-Class Accuracy	66.3	# 1
Zero-Shot Transfer Image Classification	Food-101	Diffusion Classifier (zero-shot)	Top 1 Accuracy	77.7	# 5
Zero-Shot Transfer Image Classification	ImageNet	Diffusion Classifier (zero-shot)	Accuracy (Private)	61.4	# 21
Image Classification	ImageNet	Diffusion Classifier	Top 1 Accuracy	79.1%	# 714
Domain Generalization	ImageNet-A	Diffusion Classifier	Top-1 accuracy %	30.2	# 27
Image Classification	ObjectNet (ImageNet classes)	Diffusion Classifier (zero-shot)	Top 1 Accuracy	43.4	# 1
Image Classification	ObjectNet (ImageNet classes)	Diffusion Classifier	Top 1 Accuracy	33.9	# 2
Image Classification	Oxford-IIIT Pets	Diffusion Classifier (zero-shot)	Per-Class Accuracy	87.3	# 1
Image Classification	STL-10	Diffusion Classifier (zero-shot)	Percentage correct	95.4	# 19
Visual Reasoning	Winoground	Diffusion Classifier (zero-shot)	Text Score	34.00	# 55

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/image-classification-on-flowers-102)](https://paperswithcode.com/sota/image-classification-on-flowers-102?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/image-classification-on-objectnet-imagenet)](https://paperswithcode.com/sota/image-classification-on-objectnet-imagenet?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/image-classification-on-oxford-iiit-pets-1)](https://paperswithcode.com/sota/image-classification-on-oxford-iiit-pets-1?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/zero-shot-transfer-image-classification-on-17)](https://paperswithcode.com/sota/zero-shot-transfer-image-classification-on-17?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/image-classification-on-stl-10)](https://paperswithcode.com/sota/image-classification-on-stl-10?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/zero-shot-transfer-image-classification-on-1)](https://paperswithcode.com/sota/zero-shot-transfer-image-classification-on-1?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/domain-generalization-on-imagenet-a)](https://paperswithcode.com/sota/domain-generalization-on-imagenet-a?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/fine-grained-image-classification-on-fgvc)](https://paperswithcode.com/sota/fine-grained-image-classification-on-fgvc?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/visual-reasoning-on-winoground)](https://paperswithcode.com/sota/visual-reasoning-on-winoground?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/image-classification-on-cifar-10)](https://paperswithcode.com/sota/image-classification-on-cifar-10?p=your-diffusion-model-is-secretly-a-zero-shot)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/your-diffusion-model-is-secretly-a-zero-shot/image-classification-on-imagenet)](https://paperswithcode.com/sota/image-classification-on-imagenet?p=your-diffusion-model-is-secretly-a-zero-shot)`

Your Diffusion Model is Secretly a Zero-Shot Classifier

ICCV 2023 · Alexander C. Li, Mihir Prabhudesai, Shivam Duggal, Ellis Brown, Deepak Pathak ·

The recent wave of large-scale text-to-image diffusion models has dramatically increased our text-based image generation abilities. These models can generate realistic images for a staggering variety of prompts and exhibit impressive compositional generalization abilities. Almost all use cases thus far have solely focused on sampling; however, diffusion models can also provide conditional density estimates, which are useful for tasks beyond image generation. In this paper, we show that the density estimates from large-scale text-to-image diffusion models like Stable Diffusion can be leveraged to perform zero-shot classification without any additional training. Our generative approach to classification, which we call Diffusion Classifier, attains strong results on a variety of benchmarks and outperforms alternative methods of extracting knowledge from diffusion models. Although a gap remains between generative and discriminative approaches on zero-shot recognition tasks, our diffusion-based approach has significantly stronger multimodal compositional reasoning ability than competing discriminative approaches. Finally, we use Diffusion Classifier to extract standard classifiers from class-conditional diffusion models trained on ImageNet. Our models achieve strong classification performance using only weak augmentations and exhibit qualitatively better "effective robustness" to distribution shift. Overall, our results are a step toward using generative over discriminative models for downstream tasks. Results and visualizations at https://diffusion-classifier.github.io/

PDF Abstract ICCV 2023 PDF ICCV 2023 Abstract

Code

Add Remove Mark official

diffusion-classifier/diffusion-clas… official

347

SamsungSAILMontreal/ForestDiffusion

↳ Quickstart in

Colab

Tasks

Add Remove

Domain Generalization

Fine-Grained Image Classification

Image Classification

Image Generation

Relational Reasoning

Visual Reasoning

Zero-Shot Learning

Zero-Shot Transfer Image Classification

Datasets

CIFAR-10

ImageNet

MNIST

Oxford 102 Flower

STL-10

Food-101

FGVC-Aircraft

ImageNet-A

LAION-5B

ObjectNet

Oxford-IIIT Pet Dataset Winoground Oxford-IIIT Pets

Results from the Paper

Edit

Ranked #1 on Image Classification on ObjectNet (ImageNet classes)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Image Classification	CIFAR-10	Diffusion Classifier (zero-shot)	Percentage correct	88.5	# 198	Compare
Fine-Grained Image Classification	FGVC Aircraft	Diffusion Classifier (zero-shot)	Accuracy	26.4	# 52	Compare
Image Classification	Flowers-102	Diffusion Classifier (zero-shot)	Per-Class Accuracy	66.3	# 1	Compare
Zero-Shot Transfer Image Classification	Food-101	Diffusion Classifier (zero-shot)	Top 1 Accuracy	77.7	# 5	Compare
Zero-Shot Transfer Image Classification	ImageNet	Diffusion Classifier (zero-shot)	Accuracy (Private)	61.4	# 21	Compare
Image Classification	ImageNet	Diffusion Classifier	Top 1 Accuracy	79.1%	# 714	Compare
Domain Generalization	ImageNet-A	Diffusion Classifier	Top-1 accuracy %	30.2	# 27	Compare
Image Classification	ObjectNet (ImageNet classes)	Diffusion Classifier (zero-shot)	Top 1 Accuracy	43.4	# 1	Compare
Image Classification	ObjectNet (ImageNet classes)	Diffusion Classifier	Top 1 Accuracy	33.9	# 2	Compare
Image Classification	Oxford-IIIT Pets	Diffusion Classifier (zero-shot)	Per-Class Accuracy	87.3	# 1	Compare
Image Classification	STL-10	Diffusion Classifier (zero-shot)	Percentage correct	95.4	# 19	Compare
Visual Reasoning	Winoground	Diffusion Classifier (zero-shot)	Text Score	34.00	# 55	Compare

Methods

Add Remove

Diffusion

Edit Social Preview

Your Diffusion Model is Secretly a Zero-Shot Classifier

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove