Texts

Multi-EuP: The Multilingual European Parliament Dataset for Analysis of Bias in Information Retrieval

Introduced by Yang et al. in Multi-EuP: The Multilingual European Parliament Dataset for Analysis of Bias in Information Retrieval

The Multi-Eup is a new multilingual benchmark dataset, comprising 22K multilingual documents collected from the European Parliament, spanning 24 languages. This dataset is designed to investigate fairness in a multilingual information retrieval (IR) context to analyze both language and demographic bias in a ranking context. It boasts an authentic multilingual corpus, featuring topics translated into all 24 languages, as well as cross-lingual relevance judgments. Furthermore, it offers rich demographic information associated with its documents, facilitating the study of demographic bias.

Homepage

Benchmarks

Add a new result Link an existing benchmark

Trend	Task	Dataset Variant	Best Model	Paper	Code
	Text Reranking	Multi-EuP: The Multilingual European Parliament Dataset for Analysis of Bias in Information Retrieval	BM25_whitespace_tokenizer

Papers

Paper	Code	Results	Date	Stars

Multi-EuP: The Multilingual European Parliament Dataset for Analysis of Bias in Information Retrieval

Benchmarks

Add a new result Link an existing benchmark

Papers

Dataset Loaders

Add Remove

Tasks

Similar Datasets

Mr. TYDI

Usage

License

Modalities

Languages

Multi-EuP: The Multilingual European Parliament Dataset for Analysis of Bias in Information Retrieval

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Similar Datasets

Mr. TYDI

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages