3 dataset results for Cross-Lingual Abstractive Summarization AND English

WikiLingua includes ~770k article and summary pairs in 18 languages from WikiHow. Gold-standard article-summary alignments across languages are extracted by aligning the images that are used to describe each how-to step in an article.

50 PAPERS • 5 BENCHMARKS

WikiMulti

WikiMulti (WikiMulti: a Corpus for Cross-Lingual Summarization)

wikimulti is a dataset for cross-lingual summarization based on Wikipedia articles in 15 languages.

1 PAPER • NO BENCHMARKS YET

XWikiRef

We provide a new data set XWikiRef for the task of Cross-lingual Multi-document Summarization. This task aims at generating Wikipedia style text in Low Resource languages by taking reference text as input. Overall, the data set contains 8 different languages: bengali (bn), english (en), hindi (hi), marathi (mr), malayalam (ml), odia (or), punjabi (pa) and tamil (ta). It also contains 5 domains: books, films, politicians, sportsman and writers.

1 PAPER • 1 BENCHMARK

Datasets

3 dataset results for Cross-Lingual Abstractive Summarization AND English