TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Text Classification	Amazon-2	BERT Finetune + UDA	Error	3.5	# 2
Text Classification	Amazon-5	BERT Finetune + UDA	Error	37.12	# 3
Sentiment Analysis	Amazon Review Full	BERT large	Accuracy	65.83	# 1
Sentiment Analysis	Amazon Review Full	BERT large finetune UDA	Accuracy	62.88	# 4
Sentiment Analysis	Amazon Review Polarity	BERT large finetune UDA	Accuracy	96.5	# 3
Sentiment Analysis	Amazon Review Polarity	BERT large	Accuracy	97.37	# 1
Semi-Supervised Image Classification	CIFAR-10, 4000 Labels	UDA	Percentage error	5.27	# 21
Text Classification	DBpedia	BERT large	Error	0.68	# 3
Text Classification	DBpedia	BERT large UDA	Error	1.09	# 14
Image Classification	ImageNet	ResNet-50 (UDA)	Top 1 Accuracy	79.04%	# 723
Semi-Supervised Image Classification	ImageNet - 10% labeled data	UDA	Top 5 Accuracy	88.52	# 29
Sentiment Analysis	IMDb	BERT large finetune UDA	Accuracy	95.8	# 9
Sentiment Analysis	IMDb	BERT large	Accuracy	95.49	# 14
Semi-Supervised Image Classification	SVHN, 1000 labels	UDA	Accuracy	97.54	# 5
Text Classification	Yelp-2	BERT Finetune + UDA	Accuracy	97.95%	# 3
Text Classification	Yelp-5	BERT Finetune + UDA	Accuracy	67.92%	# 6
Sentiment Analysis	Yelp Binary classification	BERT large	Error	1.89	# 4
Sentiment Analysis	Yelp Binary classification	BERT large finetune UDA	Error	2.05	# 6
Sentiment Analysis	Yelp Fine-grained classification	BERT large	Error	29.32	# 3
Sentiment Analysis	Yelp Fine-grained classification	BERT large finetune UDA	Error	32.08	# 8

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/sentiment-analysis-on-amazon-review-full)](https://paperswithcode.com/sota/sentiment-analysis-on-amazon-review-full?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/sentiment-analysis-on-amazon-review-polarity)](https://paperswithcode.com/sota/sentiment-analysis-on-amazon-review-polarity?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/text-classification-on-amazon-2)](https://paperswithcode.com/sota/text-classification-on-amazon-2?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/text-classification-on-amazon-5)](https://paperswithcode.com/sota/text-classification-on-amazon-5?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/text-classification-on-dbpedia)](https://paperswithcode.com/sota/text-classification-on-dbpedia?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/text-classification-on-yelp-2)](https://paperswithcode.com/sota/text-classification-on-yelp-2?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/sentiment-analysis-on-yelp-fine-grained)](https://paperswithcode.com/sota/sentiment-analysis-on-yelp-fine-grained?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/sentiment-analysis-on-yelp-binary)](https://paperswithcode.com/sota/sentiment-analysis-on-yelp-binary?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/semi-supervised-image-classification-on-svhn)](https://paperswithcode.com/sota/semi-supervised-image-classification-on-svhn?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/text-classification-on-yelp-5)](https://paperswithcode.com/sota/text-classification-on-yelp-5?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/sentiment-analysis-on-imdb)](https://paperswithcode.com/sota/sentiment-analysis-on-imdb?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/semi-supervised-image-classification-on-cifar)](https://paperswithcode.com/sota/semi-supervised-image-classification-on-cifar?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/semi-supervised-image-classification-on-2)](https://paperswithcode.com/sota/semi-supervised-image-classification-on-2?p=unsupervised-data-augmentation-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unsupervised-data-augmentation-1/image-classification-on-imagenet)](https://paperswithcode.com/sota/image-classification-on-imagenet?p=unsupervised-data-augmentation-1)`

Unsupervised Data Augmentation for Consistency Training

NeurIPS 2020 · Qizhe Xie, Zihang Dai, Eduard Hovy, Minh-Thang Luong, Quoc V. Le ·

Semi-supervised learning lately has shown much promise in improving deep learning models when labeled data is scarce. Common among recent approaches is the use of consistency training on a large amount of unlabeled data to constrain model predictions to be invariant to input noise. In this work, we present a new perspective on how to effectively noise unlabeled examples and argue that the quality of noising, specifically those produced by advanced data augmentation methods, plays a crucial role in semi-supervised learning. By substituting simple noising operations with advanced data augmentation methods such as RandAugment and back-translation, our method brings substantial improvements across six language and three vision tasks under the same consistency training framework. On the IMDb text classification dataset, with only 20 labeled examples, our method achieves an error rate of 4.20, outperforming the state-of-the-art model trained on 25,000 labeled examples. On a standard semi-supervised learning benchmark, CIFAR-10, our method outperforms all previous approaches and achieves an error rate of 5.43 with only 250 examples. Our method also combines well with transfer learning, e.g., when finetuning from BERT, and yields improvements in high-data regime, such as ImageNet, whether when there is only 10% labeled data or when a full labeled set with 1.3M extra unlabeled examples is used. Code is available at https://github.com/google-research/uda.

PDF Abstract NeurIPS 2020 PDF NeurIPS 2020 Abstract

Code

Add Remove Mark official

google-research/uda official

2,167

SanghunYun/UDA_pytorch

273

ildoonet/unsupervised-data-augmenta…

147

uizard-technologies/realmix

rwbfd/OpenCompetitionV2

See all 20 implementations

Tasks

Add Remove

Data Augmentation

Image Augmentation

Image Classification

Semi-Supervised Image Classification

Text Classification

Transfer Learning

Datasets

CIFAR-10

ImageNet

SVHN

IMDb Movie Reviews

DBpedia Yelp

Results from the Paper

Edit

Ranked #1 on Sentiment Analysis on Amazon Review Full

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Text Classification	Amazon-2	BERT Finetune + UDA	Error	3.5	# 2	Compare
Text Classification	Amazon-5	BERT Finetune + UDA	Error	37.12	# 3	Compare
Sentiment Analysis	Amazon Review Full	BERT large	Accuracy	65.83	# 1	Compare
Sentiment Analysis	Amazon Review Full	BERT large finetune UDA	Accuracy	62.88	# 4	Compare
Sentiment Analysis	Amazon Review Polarity	BERT large finetune UDA	Accuracy	96.5	# 3	Compare
Sentiment Analysis	Amazon Review Polarity	BERT large	Accuracy	97.37	# 1	Compare
Semi-Supervised Image Classification	CIFAR-10, 4000 Labels	UDA	Percentage error	5.27	# 21	Compare
Text Classification	DBpedia	BERT large	Error	0.68	# 3	Compare
Text Classification	DBpedia	BERT large UDA	Error	1.09	# 14	Compare
Image Classification	ImageNet	ResNet-50 (UDA)	Top 1 Accuracy	79.04%	# 723	Compare
Semi-Supervised Image Classification	ImageNet - 10% labeled data	UDA	Top 5 Accuracy	88.52	# 29	Compare
Sentiment Analysis	IMDb	BERT large finetune UDA	Accuracy	95.8	# 9	Compare
Sentiment Analysis	IMDb	BERT large	Accuracy	95.49	# 14	Compare
Semi-Supervised Image Classification	SVHN, 1000 labels	UDA	Accuracy	97.54	# 5	Compare
Text Classification	Yelp-2	BERT Finetune + UDA	Accuracy	97.95%	# 3	Compare
Text Classification	Yelp-5	BERT Finetune + UDA	Accuracy	67.92%	# 6	Compare
Sentiment Analysis	Yelp Binary classification	BERT large	Error	1.89	# 4	Compare
Sentiment Analysis	Yelp Binary classification	BERT large finetune UDA	Error	2.05	# 6	Compare
Sentiment Analysis	Yelp Fine-grained classification	BERT large	Error	29.32	# 3	Compare
Sentiment Analysis	Yelp Fine-grained classification	BERT large finetune UDA	Error	32.08	# 8	Compare

Methods

Add Remove

1x1 Convolution • Adam • Attention Dropout • Average Pooling • Batch Normalization • BERT • Bottleneck Residual Block • Convolution • Dense Connections • Dropout • GELU • Global Average Pooling • Kaiming Initialization • Layer Normalization • Linear Layer • Linear Warmup With Linear Decay • Max Pooling • Multi-Head Attention • ReLU • Residual Block • Residual Connection • ResNet • Scaled Dot-Product Attention • Softmax • Weight Decay • WordPiece

Edit Social Preview

Unsupervised Data Augmentation for Consistency Training

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove