TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Extractive Text Summarization	CNN / Daily Mail	BERT-ext + RL	ROUGE-2	19.87	# 6
Extractive Text Summarization	CNN / Daily Mail	BERT-ext + RL	ROUGE-1	42.76	# 5
Extractive Text Summarization	CNN / Daily Mail	BERT-ext + RL	ROUGE-L	39.11	# 4
Abstractive Text Summarization	CNN / Daily Mail	BERT-ext + abs + RL + rerank	ROUGE-1	41.90	# 28
Abstractive Text Summarization	CNN / Daily Mail	BERT-ext + abs + RL + rerank	ROUGE-2	19.08	# 30
Abstractive Text Summarization	CNN / Daily Mail	BERT-ext + abs + RL + rerank	ROUGE-L	39.64	# 27

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/summary-level-training-of-sentence-rewriting/extractive-document-summarization-on-cnn)](https://paperswithcode.com/sota/extractive-document-summarization-on-cnn?p=summary-level-training-of-sentence-rewriting)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/summary-level-training-of-sentence-rewriting/abstractive-text-summarization-on-cnn-daily)](https://paperswithcode.com/sota/abstractive-text-summarization-on-cnn-daily?p=summary-level-training-of-sentence-rewriting)`

Summary Level Training of Sentence Rewriting for Abstractive Summarization

WS 2019 · Sanghwan Bae, Taeuk Kim, Jihoon Kim, Sang-goo Lee ·

As an attempt to combine extractive and abstractive summarization, Sentence Rewriting models adopt the strategy of extracting salient sentences from a document first and then paraphrasing the selected ones to generate a summary. However, the existing models in this framework mostly rely on sentence-level rewards or suboptimal labels, causing a mismatch between a training objective and evaluation metric. In this paper, we present a novel training signal that directly maximizes summary-level ROUGE scores through reinforcement learning. In addition, we incorporate BERT into our model, making good use of its ability on natural language understanding. In extensive experiments, we show that a combination of our proposed model and training procedure obtains new state-of-the-art performance on both CNN/Daily Mail and New York Times datasets. We also demonstrate that it generalizes better on DUC-2002 test set.

PDF Abstract WS 2019 PDF WS 2019 Abstract

Code

Add Remove Mark official

No code implementations yet. Submit your code now

Tasks

Add Remove

Abstractive Text Summarization

Extractive Text Summarization

Natural Language Understanding

Sentence

Sentence ReWriting

Datasets

CNN/Daily Mail

New York Times Annotated Corpus

Results from the Paper

Edit

Ranked #5 on Extractive Text Summarization on CNN / Daily Mail

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Extractive Text Summarization	CNN / Daily Mail	BERT-ext + RL	ROUGE-2	19.87	# 6	Compare
			ROUGE-1	42.76	# 5	Compare
			ROUGE-L	39.11	# 4	Compare
Abstractive Text Summarization	CNN / Daily Mail	BERT-ext + abs + RL + rerank	ROUGE-1	41.90	# 28	Compare
			ROUGE-2	19.08	# 30	Compare
			ROUGE-L	39.64	# 27	Compare

Methods

Add Remove

Adam • Attention Dropout • BERT • Dense Connections • Dropout • GELU • Layer Normalization • Linear Layer • Linear Warmup With Linear Decay • Multi-Head Attention • Residual Connection • Scaled Dot-Product Attention • Softmax • Weight Decay • WordPiece

Edit Social Preview

Summary Level Training of Sentence Rewriting for Abstractive Summarization

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove