TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Text Summarization	Arxiv HEP-TH citation graph	GenCompareSum	ROUGE-1	39.96	# 26
Text Summarization	Arxiv HEP-TH citation graph	GenCompareSum	ROUGE-2	15.15	# 21
Text Summarization	Arxiv HEP-TH citation graph	GenCompareSum	ROUGE-L	36.19	# 18
Text Summarization	CORD-19	GenCompareSum	ROUGE-1	41.02	# 1
Text Summarization	CORD-19	GenCompareSum	ROUGE-2	13.79	# 1
Text Summarization	CORD-19	GenCompareSum	ROUGE-L	37.25	# 1
Text Summarization	Pubmed	GenCompareSum	ROUGE-1	42.10	# 23
Text Summarization	Pubmed	GenCompareSum	ROUGE-2	16.51	# 19
Text Summarization	Pubmed	GenCompareSum	ROUGE-L	38.25	# 16
Text Summarization	S2ORC	GenCompareSum	ROUGE-1	43.39	# 1
Text Summarization	S2ORC	GenCompareSum	ROUGE-2	16.84	# 1
Text Summarization	S2ORC	GenCompareSum	ROUGE-L	39.82	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gencomparesum-a-hybrid-unsupervised/text-summarization-on-cord-19)](https://paperswithcode.com/sota/text-summarization-on-cord-19?p=gencomparesum-a-hybrid-unsupervised)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gencomparesum-a-hybrid-unsupervised/text-summarization-on-s2orc)](https://paperswithcode.com/sota/text-summarization-on-s2orc?p=gencomparesum-a-hybrid-unsupervised)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gencomparesum-a-hybrid-unsupervised/text-summarization-on-pubmed-1)](https://paperswithcode.com/sota/text-summarization-on-pubmed-1?p=gencomparesum-a-hybrid-unsupervised)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gencomparesum-a-hybrid-unsupervised/text-summarization-on-arxiv)](https://paperswithcode.com/sota/text-summarization-on-arxiv?p=gencomparesum-a-hybrid-unsupervised)`

GenCompareSum: a hybrid unsupervised summarization method using salience

BioNLP (ACL) 2022 · Jennifer Bishop, Qianqian Xie, Sophia Ananiadou ·

Text summarization (TS) is an important NLP task. Pre-trained Language Models (PLMs) have been used to improve the performance of TS. However, PLMs are limited by their need of labelled training data and by their attention mechanism, which often makes them unsuitable for use on long documents. To this end, we propose a hybrid, unsupervised, abstractive-extractive approach, in which we walk through a document, generating salient textual fragments representing its key points. We then select the most important sentences of the document by choosing the most similar sentences to the generated texts, calculated using BERTScore. We evaluate the efficacy of generating and using salient textual fragments to guide extractive summarization on documents from the biomedical and general scientific domains. We compare the performance between long and short documents using different generative text models, which are finetuned to generate relevant queries or document titles. We show that our hybrid approach out-performs existing unsupervised methods, as well as state-of-the-art supervised methods, despite not needing a vast amount of labelled training data.

PDF Abstract

Code

Add Remove Mark official

jbshp/gencomparesum official

Tasks

Add Remove

Extractive Summarization

Text Summarization

Datasets

Pubmed

CORD-19

S2ORC Arxiv HEP-TH citation graph

Results from the Paper

Add Remove

Ranked #1 on Text Summarization on S2ORC

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Text Summarization	Arxiv HEP-TH citation graph	GenCompareSum	ROUGE-1	39.96	# 26	Compare
			ROUGE-2	15.15	# 21	Compare
			ROUGE-L	36.19	# 18	Compare
Text Summarization	CORD-19	GenCompareSum	ROUGE-1	41.02	# 1	Compare
			ROUGE-2	13.79	# 1	Compare
			ROUGE-L	37.25	# 1	Compare
Text Summarization	Pubmed	GenCompareSum	ROUGE-1	42.10	# 23	Compare
			ROUGE-2	16.51	# 19	Compare
			ROUGE-L	38.25	# 16	Compare
Text Summarization	S2ORC	GenCompareSum	ROUGE-1	43.39	# 1	Compare
			ROUGE-2	16.84	# 1	Compare
			ROUGE-L	39.82	# 1	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

GenCompareSum: a hybrid unsupervised summarization method using salience

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove