TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Image Classification	CIFAR-10	BiT-M (ResNet)	Percentage correct	98.91	# 24
Image Classification	CIFAR-10	BiT-M (ResNet)	Top-1 Accuracy	98.91	# 9
Image Classification	CIFAR-10	BiT-L (ResNet)	Percentage correct	99.37	# 7
Image Classification	CIFAR-10	BiT-L (ResNet)	Top-1 Accuracy	99.37	# 3
Image Classification	CIFAR-100	BiT-M (ResNet)	Percentage correct	92.17	# 16
Image Classification	CIFAR-100	BiT-L (ResNet)	Percentage correct	93.51	# 8
Image Classification	Flowers-102	BiT-L (ResNet)	Accuracy	99.63	# 7
Image Classification	Flowers-102	BiT-M (ResNet)	Accuracy	99.30	# 11
Image Classification	ImageNet	BiT-L (ResNet)	Top 1 Accuracy	87.54%	# 85
Image Classification	ImageNet	BiT-M (ResNet)	Top 1 Accuracy	85.39%	# 230
Image Classification	ImageNet	BiT-M (ResNet)	Number of params	928M	# 955
Image Classification	ImageNet ReaL	BiT-M	Accuracy	89.02%	# 25
Image Classification	ImageNet ReaL	BiT-L	Accuracy	90.54%	# 17
Image Classification	ImageNet ReaL	BiT-L	Params	928M	# 54
Out-of-Distribution Generalization	ImageNet-W	BiT-M (ResNet-50v2, IN-21k)	IN-W Gap	-8.6	# 1
Out-of-Distribution Generalization	ImageNet-W	BiT-M (ResNet-50v2, IN-21k)	Carton Gap	+28	# 1
Image Classification	ObjectNet	BiT-S (ResNet-152x4)	Top-5 Accuracy	57	# 13
Image Classification	ObjectNet	BiT-S (ResNet-152x4)	Top-1 Accuracy	36.0	# 50
Image Classification	ObjectNet	BiT-L (ResNet-152x4)	Top-5 Accuracy	80	# 2
Image Classification	ObjectNet	BiT-L (ResNet-152x4)	Top-1 Accuracy	58.7	# 21
Image Classification	ObjectNet	BiT-M (ResNet-152x4)	Top-5 Accuracy	69	# 5
Image Classification	ObjectNet	BiT-M (ResNet-152x4)	Top-1 Accuracy	47.0	# 33
Image Classification	ObjectNet (Bounding Box)	BiT-S (ResNet)	Top 5 Accuracy	64.4	# 3
Image Classification	ObjectNet (Bounding Box)	BiT-L (ResNet)	Top 5 Accuracy	85.1	# 1
Image Classification	ObjectNet (Bounding Box)	BiT-M (ResNet)	Top 5 Accuracy	76.0	# 2
Image Classification	OmniBenchmark	BiT-M	Average Top-1 Accuracy	40.4	# 6
Fine-Grained Image Classification	Oxford 102 Flowers	BiT-M (ResNet)	Top-1 Error Rate	0.70	# 2
Fine-Grained Image Classification	Oxford 102 Flowers	BiT-M (ResNet)	Accuracy	99.30%	# 5
Fine-Grained Image Classification	Oxford 102 Flowers	BiT-L (ResNet)	Top-1 Error Rate	0.37	# 1
Fine-Grained Image Classification	Oxford 102 Flowers	BiT-L (ResNet)	Accuracy	99.63%	# 3
Fine-Grained Image Classification	Oxford-IIIT Pets	BiT-L (ResNet)	Accuracy	96.62	# 2
Fine-Grained Image Classification	Oxford-IIIT Pets	BiT-L (ResNet)	Top-1 Error Rate	3.38%	# 2
Fine-Grained Image Classification	Oxford-IIIT Pets	BiT-M (ResNet)	Accuracy	94.47	# 4
Fine-Grained Image Classification	Oxford-IIIT Pets	BiT-M (ResNet)	Top-1 Error Rate	5.53%	# 3
Image Classification	VTAB-1k	BiT-S	Top-1 Accuracy	66.9	# 15
Image Classification	VTAB-1k	BiT-M	Top-1 Accuracy	70.6	# 11
Image Classification	VTAB-1k	BiT-L	Top-1 Accuracy	76.3	# 6
Image Classification	VTAB-1k	BiT-L (50 hypers/task)	Top-1 Accuracy	78.72	# 2

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/out-of-distribution-generalization-on-1)](https://paperswithcode.com/sota/out-of-distribution-generalization-on-1?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-objectnet-bounding)](https://paperswithcode.com/sota/image-classification-on-objectnet-bounding?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/fine-grained-image-classification-on-oxford-2)](https://paperswithcode.com/sota/fine-grained-image-classification-on-oxford-2?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-vtab-1k-1)](https://paperswithcode.com/sota/image-classification-on-vtab-1k-1?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/fine-grained-image-classification-on-oxford)](https://paperswithcode.com/sota/fine-grained-image-classification-on-oxford?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-omnibenchmark)](https://paperswithcode.com/sota/image-classification-on-omnibenchmark?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-cifar-10)](https://paperswithcode.com/sota/image-classification-on-cifar-10?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-flowers-102)](https://paperswithcode.com/sota/image-classification-on-flowers-102?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-cifar-100)](https://paperswithcode.com/sota/image-classification-on-cifar-100?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-imagenet-real)](https://paperswithcode.com/sota/image-classification-on-imagenet-real?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-objectnet)](https://paperswithcode.com/sota/image-classification-on-objectnet?p=large-scale-learning-of-general-visual)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/large-scale-learning-of-general-visual/image-classification-on-imagenet)](https://paperswithcode.com/sota/image-classification-on-imagenet?p=large-scale-learning-of-general-visual)`

Big Transfer (BiT): General Visual Representation Learning

ECCV 2020 · Alexander Kolesnikov, Lucas Beyer, Xiaohua Zhai, Joan Puigcerver, Jessica Yung, Sylvain Gelly, Neil Houlsby ·

Transfer of pre-trained representations improves sample efficiency and simplifies hyperparameter tuning when training deep neural networks for vision. We revisit the paradigm of pre-training on large supervised datasets and fine-tuning the model on a target task. We scale up pre-training, and propose a simple recipe that we call Big Transfer (BiT). By combining a few carefully selected components, and transferring using a simple heuristic, we achieve strong performance on over 20 datasets. BiT performs well across a surprisingly wide range of data regimes -- from 1 example per class to 1M total examples. BiT achieves 87.5% top-1 accuracy on ILSVRC-2012, 99.4% on CIFAR-10, and 76.3% on the 19 task Visual Task Adaptation Benchmark (VTAB). On small datasets, BiT attains 76.8% on ILSVRC-2012 with 10 examples per class, and 97.0% on CIFAR-10 with 10 examples per class. We conduct detailed analysis of the main components that lead to high transfer performance.

PDF Abstract ECCV 2020 PDF ECCV 2020 Abstract

Code

Add Remove Mark official

google-research/big_transfer official

↳ Quickstart in

Colab

1,493

sayakpaul/FunMatch-Distillation

bethgelab/InDomainGeneralizationBen…

SoojungYang/supervised_pretraining_…

sayakpaul/A-Barebones-Image-Retriev…

See all 8 implementations

Tasks

Add Remove

Few-Shot Learning

Fine-Grained Image Classification

Image Classification

Out-of-Distribution Generalization

Representation Learning

Datasets

CIFAR-10

ImageNet

MS COCO

CIFAR-100

Oxford 102 Flower

ObjectNet

JFT-300M Oxford-IIIT Pets

OmniBenchmark

ImageNet-W

Results from the Paper

Edit

Ranked #1 on Out-of-Distribution Generalization on ImageNet-W (using extra training data)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Image Classification	CIFAR-10	BiT-M (ResNet)	Percentage correct	98.91	# 24	Compare
Image Classification	CIFAR-10	BiT-M (ResNet)	Top-1 Accuracy	98.91	# 9	Compare
Image Classification	CIFAR-10	BiT-L (ResNet)	Percentage correct	99.37	# 7	Compare
Image Classification	CIFAR-10	BiT-L (ResNet)	Top-1 Accuracy	99.37	# 3	Compare
Image Classification	CIFAR-100	BiT-M (ResNet)	Percentage correct	92.17	# 16	Compare
Image Classification	CIFAR-100	BiT-L (ResNet)	Percentage correct	93.51	# 8	Compare
Image Classification	Flowers-102	BiT-L (ResNet)	Accuracy	99.63	# 7	Compare
Image Classification	Flowers-102	BiT-M (ResNet)	Accuracy	99.30	# 11	Compare
Image Classification	ImageNet	BiT-L (ResNet)	Top 1 Accuracy	87.54%	# 85	Compare
Image Classification	ImageNet	BiT-M (ResNet)	Top 1 Accuracy	85.39%	# 230	Compare
Image Classification	ImageNet	BiT-M (ResNet)	Number of params	928M	# 955	Compare
Image Classification	ImageNet ReaL	BiT-M	Accuracy	89.02%	# 25	Compare
Image Classification	ImageNet ReaL	BiT-L	Accuracy	90.54%	# 17	Compare
Image Classification	ImageNet ReaL	BiT-L	Params	928M	# 54	Compare
Out-of-Distribution Generalization	ImageNet-W	BiT-M (ResNet-50v2, IN-21k)	IN-W Gap	-8.6	# 1	Compare
Out-of-Distribution Generalization	ImageNet-W	BiT-M (ResNet-50v2, IN-21k)	Carton Gap	+28	# 1	Compare
Image Classification	ObjectNet	BiT-S (ResNet-152x4)	Top-5 Accuracy	57	# 13	Compare
Image Classification	ObjectNet	BiT-S (ResNet-152x4)	Top-1 Accuracy	36.0	# 50	Compare
Image Classification	ObjectNet	BiT-L (ResNet-152x4)	Top-5 Accuracy	80	# 2	Compare
Image Classification	ObjectNet	BiT-L (ResNet-152x4)	Top-1 Accuracy	58.7	# 21	Compare
Image Classification	ObjectNet	BiT-M (ResNet-152x4)	Top-5 Accuracy	69	# 5	Compare
Image Classification	ObjectNet	BiT-M (ResNet-152x4)	Top-1 Accuracy	47.0	# 33	Compare
Image Classification	ObjectNet (Bounding Box)	BiT-S (ResNet)	Top 5 Accuracy	64.4	# 3	Compare
Image Classification	ObjectNet (Bounding Box)	BiT-L (ResNet)	Top 5 Accuracy	85.1	# 1	Compare
Image Classification	ObjectNet (Bounding Box)	BiT-M (ResNet)	Top 5 Accuracy	76.0	# 2	Compare
Image Classification	OmniBenchmark	BiT-M	Average Top-1 Accuracy	40.4	# 6	Compare
Fine-Grained Image Classification	Oxford 102 Flowers	BiT-M (ResNet)	Top-1 Error Rate	0.70	# 2	Compare
Fine-Grained Image Classification	Oxford 102 Flowers	BiT-M (ResNet)	Accuracy	99.30%	# 5	Compare
Fine-Grained Image Classification	Oxford 102 Flowers	BiT-L (ResNet)	Top-1 Error Rate	0.37	# 1	Compare
Fine-Grained Image Classification	Oxford 102 Flowers	BiT-L (ResNet)	Accuracy	99.63%	# 3	Compare
Fine-Grained Image Classification	Oxford-IIIT Pets	BiT-L (ResNet)	Accuracy	96.62	# 2	Compare
Fine-Grained Image Classification	Oxford-IIIT Pets	BiT-L (ResNet)	Top-1 Error Rate	3.38%	# 2	Compare
Fine-Grained Image Classification	Oxford-IIIT Pets	BiT-M (ResNet)	Accuracy	94.47	# 4	Compare
Fine-Grained Image Classification	Oxford-IIIT Pets	BiT-M (ResNet)	Top-1 Error Rate	5.53%	# 3	Compare
Image Classification	VTAB-1k	BiT-S	Top-1 Accuracy	66.9	# 15	Compare
Image Classification	VTAB-1k	BiT-M	Top-1 Accuracy	70.6	# 11	Compare
Image Classification	VTAB-1k	BiT-L	Top-1 Accuracy	76.3	# 6	Compare
Image Classification	VTAB-1k	BiT-L (50 hypers/task)	Top-1 Accuracy	78.72	# 2	Compare

Methods

Add Remove

1x1 Convolution • Average Pooling • Bottleneck Residual Block • Convolution • FixRes • Global Average Pooling • Group Normalization • Kaiming Initialization • Max Pooling • Mixup • Random Horizontal Flip • Random Resized Crop • ReLU • Residual Block • Residual Connection • ResNet • SGD with Momentum • Weight Standardization

Edit Social Preview

Big Transfer (BiT): General Visual Representation Learning

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove