TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Abstractive Text Summarization	CNN / Daily Mail	PALM	ROUGE-1	44.30	# 16
Abstractive Text Summarization	CNN / Daily Mail	PALM	ROUGE-2	21.12	# 20
Abstractive Text Summarization	CNN / Daily Mail	PALM	ROUGE-L	41.41	# 9
Text Generation	CNN/Daily Mail	PALM	ROUGE-L	41.41	# 1
Text Summarization	GigaWord	PALM	ROUGE-1	39.45	# 9
Text Summarization	GigaWord	PALM	ROUGE-2	20.37	# 11
Text Summarization	GigaWord	PALM	ROUGE-L	36.75	# 6

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/palm-pre-training-an-autoencoding/text-generation-on-cnn-daily-mail)](https://paperswithcode.com/sota/text-generation-on-cnn-daily-mail?p=palm-pre-training-an-autoencoding)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/palm-pre-training-an-autoencoding/text-summarization-on-gigaword)](https://paperswithcode.com/sota/text-summarization-on-gigaword?p=palm-pre-training-an-autoencoding)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/palm-pre-training-an-autoencoding/abstractive-text-summarization-on-cnn-daily)](https://paperswithcode.com/sota/abstractive-text-summarization-on-cnn-daily?p=palm-pre-training-an-autoencoding)`

PALM: Pre-training an Autoencoding&Autoregressive Language Model for Context-conditioned Generation

14 Apr 2020 · Bin Bi, Chenliang Li, Chen Wu, Ming Yan, Wei Wang, Songfang Huang, Fei Huang, Luo Si ·

Self-supervised pre-training, such as BERT, MASS and BART, has emerged as a powerful technique for natural language understanding and generation. Existing pre-training techniques employ autoencoding and/or autoregressive objectives to train Transformer-based models by recovering original word tokens from corrupted text with some masked tokens. The training goals of existing techniques are often inconsistent with the goals of many language generation tasks, such as generative question answering and conversational response generation, for producing new text given context. This work presents PALM with a novel scheme that jointly pre-trains an autoencoding and autoregressive language model on a large unlabeled corpus, specifically designed for generating new text conditioned on context. The new scheme alleviates the mismatch introduced by the existing denoising scheme between pre-training and fine-tuning where generation is more than reconstructing original text. An extensive set of experiments show that PALM achieves new state-of-the-art results on a variety of language generation benchmarks covering generative question answering (Rank 1 on the official MARCO leaderboard), abstractive summarization on CNN/DailyMail as well as Gigaword, question generation on SQuAD, and conversational response generation on Cornell Movie Dialogues.

PDF Abstract

Code

Add Remove Mark official

alibaba/AliceMind official

1,933

overwindows/PALM

Tasks

Add Remove

Abstractive Text Summarization

Conversational Response Generation

Denoising

Generative Question Answering

Language Modelling

Natural Language Understanding

Question Answering

Question Generation

Question-Generation

Response Generation

Text Generation

Text Summarization

Datasets

SQuAD

CNN/Daily Mail

BookCorpus

Results from the Paper

Edit

Ranked #1 on Text Generation on CNN/Daily Mail

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Abstractive Text Summarization	CNN / Daily Mail	PALM	ROUGE-1	44.30	# 16	Compare
			ROUGE-2	21.12	# 20	Compare
			ROUGE-L	41.41	# 9	Compare
Text Generation	CNN/Daily Mail	PALM	ROUGE-L	41.41	# 1	Compare
Text Summarization	GigaWord	PALM	ROUGE-1	39.45	# 9	Compare
			ROUGE-2	20.37	# 11	Compare
			ROUGE-L	36.75	# 6	Compare

Methods

Add Remove

Adam • Attention Dropout • BART • BERT • BPE • Dense Connections • Dropout • GELU • Layer Normalization • Linear Layer • Linear Warmup With Linear Decay • Multi-Head Attention • Residual Connection • Scaled Dot-Product Attention • Softmax • Weight Decay • WordPiece

Edit Social Preview

PALM: Pre-training an Autoencoding&Autoregressive Language Model for Context-conditioned Generation

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove