TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Fine-Grained Image Classification	Caltech-101	TWIST (ResNet-50 )	Top-1 Error Rate	6.5%	# 6
Fine-Grained Image Classification	Caltech-101	TWIST (ResNet-50 )	Accuracy	93.5%	# 3
Image Classification	DTD	TWIST (ResNet-50)	Accuracy	76.6	# 7
Image Classification	Food-101	TWIST (ResNet-50)	Accuracy (%)	89.3	# 3
Unsupervised Image Classification	ImageNet	TWIST (ResNet-50)	Accuracy (%)	40.6	# 4
Unsupervised Image Classification	ImageNet	TWIST (ResNet-50)	ARI	30.0	# 2
Semi-Supervised Image Classification	ImageNet - 10% labeled data	TWIST (ResNet-50 x2)	Top 5 Accuracy	92.8%	# 6
Semi-Supervised Image Classification	ImageNet - 10% labeled data	TWIST (ResNet-50 x2)	Top 1 Accuracy	75.3%	# 19
Semi-Supervised Image Classification	ImageNet - 1% labeled data	TWIST (ResNet-50 x2)	Top 5 Accuracy	88.2%	# 7
Semi-Supervised Image Classification	ImageNet - 1% labeled data	TWIST (ResNet-50 x2)	Top 1 Accuracy	67.2%	# 19
Image Classification	Oxford-IIIT Pet Dataset	TWIST (ResNet-50)	Accuracy	94.5	# 1
Fine-Grained Image Classification	SUN397	TWIST (ResNet-50)	Accuracy	67.4	# 4

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/self-supervised-learning-by-estimating-twin-1/image-classification-on-oxford-iiit-pets)](https://paperswithcode.com/sota/image-classification-on-oxford-iiit-pets?p=self-supervised-learning-by-estimating-twin-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/self-supervised-learning-by-estimating-twin-1/unsupervised-image-classification-on-imagenet)](https://paperswithcode.com/sota/unsupervised-image-classification-on-imagenet?p=self-supervised-learning-by-estimating-twin-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/self-supervised-learning-by-estimating-twin-1/image-classification-on-food-101-1)](https://paperswithcode.com/sota/image-classification-on-food-101-1?p=self-supervised-learning-by-estimating-twin-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/self-supervised-learning-by-estimating-twin-1/fine-grained-image-classification-on-sun397)](https://paperswithcode.com/sota/fine-grained-image-classification-on-sun397?p=self-supervised-learning-by-estimating-twin-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/self-supervised-learning-by-estimating-twin-1/fine-grained-image-classification-on-caltech)](https://paperswithcode.com/sota/fine-grained-image-classification-on-caltech?p=self-supervised-learning-by-estimating-twin-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/self-supervised-learning-by-estimating-twin-1/image-classification-on-dtd)](https://paperswithcode.com/sota/image-classification-on-dtd?p=self-supervised-learning-by-estimating-twin-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/self-supervised-learning-by-estimating-twin-1/semi-supervised-image-classification-on-2)](https://paperswithcode.com/sota/semi-supervised-image-classification-on-2?p=self-supervised-learning-by-estimating-twin-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/self-supervised-learning-by-estimating-twin-1/semi-supervised-image-classification-on-1)](https://paperswithcode.com/sota/semi-supervised-image-classification-on-1?p=self-supervised-learning-by-estimating-twin-1)`

Self-Supervised Learning by Estimating Twin Class Distributions

14 Oct 2021 · Feng Wang, Tao Kong, Rufeng Zhang, Huaping Liu, Hang Li ·

We present TWIST, a simple and theoretically explainable self-supervised representation learning method by classifying large-scale unlabeled datasets in an end-to-end way. We employ a siamese network terminated by a softmax operation to produce twin class distributions of two augmented images. Without supervision, we enforce the class distributions of different augmentations to be consistent. However, simply minimizing the divergence between augmentations will cause collapsed solutions, i.e., outputting the same class probability distribution for all images. In this case, no information about the input image is left. To solve this problem, we propose to maximize the mutual information between the input and the class predictions. Specifically, we minimize the entropy of the distribution for each sample to make the class prediction for each sample assertive and maximize the entropy of the mean distribution to make the predictions of different samples diverse. In this way, TWIST can naturally avoid the collapsed solutions without specific designs such as asymmetric network, stop-gradient operation, or momentum encoder. As a result, TWIST outperforms state-of-the-art methods on a wide range of tasks. Especially, TWIST performs surprisingly well on semi-supervised learning, achieving 61.2% top-1 accuracy with 1% ImageNet labels using a ResNet-50 as backbone, surpassing previous best results by an absolute improvement of 6.2%. Codes and pre-trained models are given on: https://github.com/bytedance/TWIST

PDF Abstract

Code

Add Remove Mark official

bytedance/TWIST official

beresandras/contrastive-classificat…

↳ Quickstart in

Colab

Tasks

Add Remove

Fine-Grained Image Classification

Image Classification

Representation Learning

Self-Supervised Image Classification

Self-Supervised Learning

Semi-Supervised Image Classification

Transfer Learning

Unsupervised Image Classification

Datasets

CIFAR-10

ImageNet

MS COCO

CIFAR-100

Cityscapes

Oxford 102 Flower

DTD

Food-101

Caltech-101

Oxford-IIIT Pet Dataset Oxford-IIIT Pets

SUN397

Results from the Paper

Edit

Ranked #1 on Image Classification on Oxford-IIIT Pet Dataset

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Fine-Grained Image Classification	Caltech-101	TWIST (ResNet-50 )	Top-1 Error Rate	6.5%	# 6	Compare
Fine-Grained Image Classification	Caltech-101	TWIST (ResNet-50 )	Accuracy	93.5%	# 3	Compare
Image Classification	DTD	TWIST (ResNet-50)	Accuracy	76.6	# 7	Compare
Image Classification	Food-101	TWIST (ResNet-50)	Accuracy (%)	89.3	# 3	Compare
Unsupervised Image Classification	ImageNet	TWIST (ResNet-50)	Accuracy (%)	40.6	# 4	Compare
Unsupervised Image Classification	ImageNet	TWIST (ResNet-50)	ARI	30.0	# 2	Compare
Semi-Supervised Image Classification	ImageNet - 10% labeled data	TWIST (ResNet-50 x2)	Top 5 Accuracy	92.8%	# 6	Compare
Semi-Supervised Image Classification	ImageNet - 10% labeled data	TWIST (ResNet-50 x2)	Top 1 Accuracy	75.3%	# 19	Compare
Semi-Supervised Image Classification	ImageNet - 1% labeled data	TWIST (ResNet-50 x2)	Top 5 Accuracy	88.2%	# 7	Compare
Semi-Supervised Image Classification	ImageNet - 1% labeled data	TWIST (ResNet-50 x2)	Top 1 Accuracy	67.2%	# 19	Compare
Image Classification	Oxford-IIIT Pet Dataset	TWIST (ResNet-50)	Accuracy	94.5	# 1	Compare
Fine-Grained Image Classification	SUN397	TWIST (ResNet-50)	Accuracy	67.4	# 4	Compare

Methods

Add Remove

Siamese Network • Softmax

Edit Social Preview

Self-Supervised Learning by Estimating Twin Class Distributions

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove