TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Domain Generalization	ImageNet-A	Stylized ImageNet (ResNet-50)	Top-1 accuracy %	2.3	# 38
Domain Generalization	ImageNet-C	Stylized ImageNet (ResNet-50)	mean Corruption Error (mCE)	69.3	# 38
Domain Generalization	ImageNet-R	Stylized ImageNet (ResNet-50)	Top-1 Error Rate	58.5	# 34
Out-of-Distribution Generalization	ImageNet-W	Style Transfer (ResNet-50)	IN-W Gap	-17.3	# 1
Out-of-Distribution Generalization	ImageNet-W	Style Transfer (ResNet-50)	Carton Gap	+52	# 1
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN)	Accuracy - All Images	25.3	# 86
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN)	Accuracy - Corrupted Images	20.4	# 85
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN)	Accuracy - Clean Images	30	# 86
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN_IN_IN)	Accuracy - All Images	39.2	# 40
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN_IN_IN)	Accuracy - Corrupted Images	32.4	# 42
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN_IN_IN)	Accuracy - Clean Images	44.6	# 36
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN_IN)	Accuracy - All Images	38.2	# 49
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN_IN)	Accuracy - Corrupted Images	32.5	# 40
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN_IN)	Accuracy - Clean Images	42.7	# 48

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/imagenet-trained-cnns-are-biased-towards/out-of-distribution-generalization-on-1)](https://paperswithcode.com/sota/out-of-distribution-generalization-on-1?p=imagenet-trained-cnns-are-biased-towards)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/imagenet-trained-cnns-are-biased-towards/domain-generalization-on-imagenet-r)](https://paperswithcode.com/sota/domain-generalization-on-imagenet-r?p=imagenet-trained-cnns-are-biased-towards)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/imagenet-trained-cnns-are-biased-towards/domain-generalization-on-imagenet-a)](https://paperswithcode.com/sota/domain-generalization-on-imagenet-a?p=imagenet-trained-cnns-are-biased-towards)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/imagenet-trained-cnns-are-biased-towards/domain-generalization-on-imagenet-c)](https://paperswithcode.com/sota/domain-generalization-on-imagenet-c?p=imagenet-trained-cnns-are-biased-towards)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/imagenet-trained-cnns-are-biased-towards/domain-generalization-on-vizwiz)](https://paperswithcode.com/sota/domain-generalization-on-vizwiz?p=imagenet-trained-cnns-are-biased-towards)`

ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness

ICLR 2019 · Robert Geirhos, Patricia Rubisch, Claudio Michaelis, Matthias Bethge, Felix A. Wichmann, Wieland Brendel ·

Convolutional Neural Networks (CNNs) are commonly thought to recognise objects by learning increasingly complex representations of object shapes. Some recent studies suggest a more important role of image textures. We here put these conflicting hypotheses to a quantitative test by evaluating CNNs and human observers on images with a texture-shape cue conflict. We show that ImageNet-trained CNNs are strongly biased towards recognising textures rather than shapes, which is in stark contrast to human behavioural evidence and reveals fundamentally different classification strategies. We then demonstrate that the same standard architecture (ResNet-50) that learns a texture-based representation on ImageNet is able to learn a shape-based representation instead when trained on "Stylized-ImageNet", a stylized version of ImageNet. This provides a much better fit for human behavioural performance in our well-controlled psychophysical lab setting (nine experiments totalling 48,560 psychophysical trials across 97 observers) and comes with a number of unexpected emergent benefits such as improved object detection performance and previously unseen robustness towards a wide range of image distortions, highlighting advantages of a shape-based representation.

PDF Abstract ICLR 2019 PDF ICLR 2019 Abstract

Code

Add Remove Mark official

rgeirhos/Stylized-ImageNet official

495

rgeirhos/texture-vs-shape

768

LiYingwei/ShapeTextureDebiasedTrain…

108

facebookresearch/augmentation-corru…

mbuet2ner/local-global-features-cnn

↳ Quickstart in

Colab

See all 7 implementations

Tasks

Add Remove

Domain Generalization

Image Classification

object-detection

Object Detection

Out-of-Distribution Generalization

Datasets

Introduced in the Paper:

Stylized ImageNet

Used in the Paper:

ImageNet

ImageNet-C

ImageNet-R

ImageNet-A

ImageNet-W

VizWiz-Classification

Results from the Paper

Edit

Ranked #1 on Out-of-Distribution Generalization on ImageNet-W

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Domain Generalization	ImageNet-A	Stylized ImageNet (ResNet-50)	Top-1 accuracy %	2.3	# 38	Compare
Domain Generalization	ImageNet-C	Stylized ImageNet (ResNet-50)	mean Corruption Error (mCE)	69.3	# 38	Compare
Domain Generalization	ImageNet-R	Stylized ImageNet (ResNet-50)	Top-1 Error Rate	58.5	# 34	Compare
Out-of-Distribution Generalization	ImageNet-W	Style Transfer (ResNet-50)	IN-W Gap	-17.3	# 1	Compare
Out-of-Distribution Generalization	ImageNet-W	Style Transfer (ResNet-50)	Carton Gap	+52	# 1	Compare
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN)	Accuracy - All Images	25.3	# 86	Compare
			Accuracy - Corrupted Images	20.4	# 85	Compare
			Accuracy - Clean Images	30	# 86	Compare
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN_IN_IN)	Accuracy - All Images	39.2	# 40	Compare
			Accuracy - Corrupted Images	32.4	# 42	Compare
			Accuracy - Clean Images	44.6	# 36	Compare
Domain Generalization	VizWiz-Classification	ResNet-50 (SIN_IN)	Accuracy - All Images	38.2	# 49	Compare
			Accuracy - Corrupted Images	32.5	# 40	Compare
			Accuracy - Clean Images	42.7	# 48	Compare

Methods

Add Remove

1x1 Convolution • Average Pooling • Batch Normalization • Bottleneck Residual Block • Convolution • Global Average Pooling • Kaiming Initialization • Max Pooling • ReLU • Residual Block • Residual Connection • ResNet

Edit Social Preview

ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove