Texts

XSum

Introduced by Narayan et al. in Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization

The Extreme Summarization (XSum) dataset is a dataset for evaluation of abstractive single-document summarization systems. The goal is to create a short, one-sentence new summary answering the question “What is the article about?”. The dataset consists of 226,711 news articles accompanied with a one-sentence summary. The articles are collected from BBC articles (2010 to 2017) and cover a wide variety of domains (e.g., News, Politics, Sports, Weather, Business, Technology, Science, Health, Family, Education, Entertainment and Arts). The official random split contains 204,045 (90%), 11,332 (5%) and 11,334 (5) documents in training, validation and test sets, respectively.

Source: https://arxiv.org/pdf/1808.08745.pdf

Homepage

Benchmarks

Add a new result Link an existing benchmark

Task	Dataset Variant	Best Model
Text Summarization	X-Sum	Pegasus 2B + SLiC
Sequence-to-sequence Language Modeling	XSum	t5-small-finetuned-xsum-wei2
Summarization	XSum	google/pegasus-xsum
Extreme Summarization	XSum	PEGASUS
Abstractive Text Summarization	XSum	MEETING_SUMMARY
Text Summarization	XSum	SRformer-BART