TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Abstractive Text Summarization	CNN / Daily Mail	UniLM	ROUGE-1	43.08	# 25
Abstractive Text Summarization	CNN / Daily Mail	UniLM	ROUGE-2	20.43	# 21
Abstractive Text Summarization	CNN / Daily Mail	UniLM	ROUGE-L	40.34	# 24
Document Summarization	CNN / Daily Mail	UniLM (Abstractive Summarization)	ROUGE-1	43.08	# 13
Document Summarization	CNN / Daily Mail	UniLM (Abstractive Summarization)	ROUGE-2	20.43	# 10
Document Summarization	CNN / Daily Mail	UniLM (Abstractive Summarization)	ROUGE-L	40.34	# 11
Generative Question Answering	CoQA	UniLM	F1-Score	82.5	# 2
Text Summarization	GigaWord	UniLM	ROUGE-1	38.90	# 16
Text Summarization	GigaWord	UniLM	ROUGE-2	20.05	# 14
Text Summarization	GigaWord	UniLM	ROUGE-L	36.00	# 17
Question Generation	SQuAD1.1	UniLM	BLEU-4	22.78	# 8
Question Generation	SQuAD1.1	UniLM	METEOR	25.1	# 6
Question Generation	SQuAD1.1	UniLM	ROUGE-L	51.1	# 6

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unified-language-model-pre-training-for/generative-question-answering-on-coqa)](https://paperswithcode.com/sota/generative-question-answering-on-coqa?p=unified-language-model-pre-training-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unified-language-model-pre-training-for/question-generation-on-squad11)](https://paperswithcode.com/sota/question-generation-on-squad11?p=unified-language-model-pre-training-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unified-language-model-pre-training-for/document-summarization-on-cnn-daily-mail)](https://paperswithcode.com/sota/document-summarization-on-cnn-daily-mail?p=unified-language-model-pre-training-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unified-language-model-pre-training-for/text-summarization-on-gigaword)](https://paperswithcode.com/sota/text-summarization-on-gigaword?p=unified-language-model-pre-training-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/unified-language-model-pre-training-for/abstractive-text-summarization-on-cnn-daily)](https://paperswithcode.com/sota/abstractive-text-summarization-on-cnn-daily?p=unified-language-model-pre-training-for)`

Unified Language Model Pre-training for Natural Language Understanding and Generation

NeurIPS 2019 · Li Dong, Nan Yang, Wenhui Wang, Furu Wei, Xiaodong Liu, Yu Wang, Jianfeng Gao, Ming Zhou, Hsiao-Wuen Hon ·

This paper presents a new Unified pre-trained Language Model (UniLM) that can be fine-tuned for both natural language understanding and generation tasks. The model is pre-trained using three types of language modeling tasks: unidirectional, bidirectional, and sequence-to-sequence prediction. The unified modeling is achieved by employing a shared Transformer network and utilizing specific self-attention masks to control what context the prediction conditions on. UniLM compares favorably with BERT on the GLUE benchmark, and the SQuAD 2.0 and CoQA question answering tasks. Moreover, UniLM achieves new state-of-the-art results on five natural language generation datasets, including improving the CNN/DailyMail abstractive summarization ROUGE-L to 40.51 (2.04 absolute improvement), the Gigaword abstractive summarization ROUGE-L to 35.75 (0.86 absolute improvement), the CoQA generative question answering F1 score to 82.5 (37.1 absolute improvement), the SQuAD question generation BLEU-4 to 22.12 (3.75 absolute improvement), and the DSTC7 document-grounded dialog response generation NIST-4 to 2.67 (human performance is 2.65). The code and pre-trained models are available at https://github.com/microsoft/unilm.

PDF Abstract NeurIPS 2019 PDF NeurIPS 2019 Abstract

Code

Add Remove Mark official

microsoft/unilm official

↳ Quickstart in

Spaces

18,335

YunwenTechnology/Unilm

434

facebookresearch/data2vec_vision

KnightZhang625/BERT_TF

robinsongh381/unilm_pytorch_korean

See all 9 implementations

Tasks

Add Remove

Abstractive Text Summarization

Document Summarization

Generative Question Answering

Language Modelling

Natural Language Understanding

Question Answering

Question Generation

Question-Generation

Response Generation

Text Generation

Text Summarization

Datasets

Introduced in the Paper:

Liu et al. Corpus

Used in the Paper:

GLUE

SQuAD

CNN/Daily Mail

CoQA

Results from the Paper

Add Remove

Ranked #2 on Generative Question Answering on CoQA (using extra training data)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Abstractive Text Summarization	CNN / Daily Mail	UniLM	ROUGE-1	43.08	# 25	Compare
			ROUGE-2	20.43	# 21	Compare
			ROUGE-L	40.34	# 24	Compare
Document Summarization	CNN / Daily Mail	UniLM (Abstractive Summarization)	ROUGE-1	43.08	# 13	Compare
			ROUGE-2	20.43	# 10	Compare
			ROUGE-L	40.34	# 11	Compare
Generative Question Answering	CoQA	UniLM	F1-Score	82.5	# 2	Compare
Text Summarization	GigaWord	UniLM	ROUGE-1	38.90	# 16	Compare
			ROUGE-2	20.05	# 14	Compare
			ROUGE-L	36.00	# 17	Compare
Question Generation	SQuAD1.1	UniLM	BLEU-4	22.78	# 8	Compare
			METEOR	25.1	# 6	Compare
			ROUGE-L	51.1	# 6	Compare

Methods

Add Remove

Absolute Position Encodings • Adam • Attention Dropout • BERT • BPE • Dense Connections • Dropout • GELU • Label Smoothing • Layer Normalization • Linear Layer • Linear Warmup With Linear Decay • Multi-Head Attention • Position-Wise Feed-Forward Layer • ReLU • Residual Connection • Scaled Dot-Product Attention • Softmax • Transformer • Weight Decay • WordPiece

Edit Social Preview

Unified Language Model Pre-training for Natural Language Understanding and Generation

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove