TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Node Classification	MuMiN-large	HeteroGraphSAGE	Claim Classification Macro-F1	0.5980	# 1
Node Classification	MuMiN-large	HeteroGraphSAGE	Tweet Classification Macro-F1	0.6145	# 1
Node Classification	MuMiN-large	Random	Claim Classification Macro-F1	0.3879	# 4
Node Classification	MuMiN-large	Random	Tweet Classification Macro-F1	0.3690	# 4
Node Classification	MuMiN-large	Majority class	Claim Classification Macro-F1	0.4813	# 3
Node Classification	MuMiN-large	Majority class	Tweet Classification Macro-F1	0.4887	# 3
Node Classification	MuMiN-large	LaBSE	Claim Classification Macro-F1	0.5790	# 2
Node Classification	MuMiN-large	LaBSE	Tweet Classification Macro-F1	0.5280	# 2
Node Classification	MuMiN-medium	Random	Claim Classification Macro-F1	0.3896	# 4
Node Classification	MuMiN-medium	Random	Tweet Classification Macro-F1	0.3772	# 4
Node Classification	MuMiN-medium	LaBSE	Claim Classification Macro-F1	0.5585	# 2
Node Classification	MuMiN-medium	LaBSE	Tweet Classification Macro-F1	0.5745	# 1
Node Classification	MuMiN-medium	HeteroGraphSAGE	Claim Classification Macro-F1	0.5770	# 1
Node Classification	MuMiN-medium	HeteroGraphSAGE	Tweet Classification Macro-F1	0.5410	# 2
Node Classification	MuMiN-medium	Majority class	Claim Classification Macro-F1	0.4806	# 3
Node Classification	MuMiN-medium	Majority class	Tweet Classification Macro-F1	0.4856	# 3
Node Classification	MuMiN-small	HeteroGraphSAGE	Claim Classification Macro-F1	0.5795	# 2
Node Classification	MuMiN-small	HeteroGraphSAGE	Tweet Classification Macro-F1	0.5605	# 1
Node Classification	MuMiN-small	Random	Claim Classification Macro-F1	0.4007	# 4
Node Classification	MuMiN-small	Random	Tweet Classification Macro-F1	0.3718	# 4
Node Classification	MuMiN-small	Majority class	Claim Classification Macro-F1	0.4756	# 3
Node Classification	MuMiN-small	Majority class	Tweet Classification Macro-F1	0.4877	# 3
Node Classification	MuMiN-small	LaBSE	Claim Classification Macro-F1	0.6255	# 1
Node Classification	MuMiN-small	LaBSE	Tweet Classification Macro-F1	0.5450	# 2

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mumin-a-large-scale-multilingual-multimodal/node-classification-on-mumin-large)](https://paperswithcode.com/sota/node-classification-on-mumin-large?p=mumin-a-large-scale-multilingual-multimodal)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mumin-a-large-scale-multilingual-multimodal/node-classification-on-mumin-medium)](https://paperswithcode.com/sota/node-classification-on-mumin-medium?p=mumin-a-large-scale-multilingual-multimodal)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mumin-a-large-scale-multilingual-multimodal/node-classification-on-mumin-small)](https://paperswithcode.com/sota/node-classification-on-mumin-small?p=mumin-a-large-scale-multilingual-multimodal)`

MuMiN: A Large-Scale Multilingual Multimodal Fact-Checked Misinformation Social Network Dataset

23 Feb 2022 · Dan Saattrup Nielsen, Ryan McConville ·

Misinformation is becoming increasingly prevalent on social media and in news articles. It has become so widespread that we require algorithmic assistance utilising machine learning to detect such content. Training these machine learning models require datasets of sufficient scale, diversity and quality. However, datasets in the field of automatic misinformation detection are predominantly monolingual, include a limited amount of modalities and are not of sufficient scale and quality. Addressing this, we develop a data collection and linking system (MuMiN-trawl), to build a public misinformation graph dataset (MuMiN), containing rich social media data (tweets, replies, users, images, articles, hashtags) spanning 21 million tweets belonging to 26 thousand Twitter threads, each of which have been semantically linked to 13 thousand fact-checked claims across dozens of topics, events and domains, in 41 different languages, spanning more than a decade. The dataset is made available as a heterogeneous graph via a Python package (mumin). We provide baseline results for two node classification tasks related to the veracity of a claim involving social media, and demonstrate that these are challenging tasks, with the highest macro-average F1-score being 62.55% and 61.45% for the two tasks, respectively. The MuMiN ecosystem is available at https://mumin-dataset.github.io/, including the data, documentation, tutorials and leaderboards.

PDF Abstract

Code

Add Remove Mark official

MuMiN-dataset/mumin-build official

↳ Quickstart in

Colab

MuMiN-dataset/mumin-baseline

MuMiN-dataset/mumin-trawl

Tasks

Add Remove

Misinformation

Node Classification

Datasets

Introduced in the Paper:

MuMiN

MuMiN-medium

MuMiN-small

MuMiN-large

Results from the Paper

Edit

Ranked #1 on Node Classification on MuMiN-small

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Node Classification	MuMiN-large	HeteroGraphSAGE	Claim Classification Macro-F1	0.5980	# 1	Compare
Node Classification	MuMiN-large	HeteroGraphSAGE	Tweet Classification Macro-F1	0.6145	# 1	Compare
Node Classification	MuMiN-large	Random	Claim Classification Macro-F1	0.3879	# 4	Compare
Node Classification	MuMiN-large	Random	Tweet Classification Macro-F1	0.3690	# 4	Compare
Node Classification	MuMiN-large	Majority class	Claim Classification Macro-F1	0.4813	# 3	Compare
Node Classification	MuMiN-large	Majority class	Tweet Classification Macro-F1	0.4887	# 3	Compare
Node Classification	MuMiN-large	LaBSE	Claim Classification Macro-F1	0.5790	# 2	Compare
Node Classification	MuMiN-large	LaBSE	Tweet Classification Macro-F1	0.5280	# 2	Compare
Node Classification	MuMiN-medium	Random	Claim Classification Macro-F1	0.3896	# 4	Compare
Node Classification	MuMiN-medium	Random	Tweet Classification Macro-F1	0.3772	# 4	Compare
Node Classification	MuMiN-medium	LaBSE	Claim Classification Macro-F1	0.5585	# 2	Compare
Node Classification	MuMiN-medium	LaBSE	Tweet Classification Macro-F1	0.5745	# 1	Compare
Node Classification	MuMiN-medium	HeteroGraphSAGE	Claim Classification Macro-F1	0.5770	# 1	Compare
Node Classification	MuMiN-medium	HeteroGraphSAGE	Tweet Classification Macro-F1	0.5410	# 2	Compare
Node Classification	MuMiN-medium	Majority class	Claim Classification Macro-F1	0.4806	# 3	Compare
Node Classification	MuMiN-medium	Majority class	Tweet Classification Macro-F1	0.4856	# 3	Compare
Node Classification	MuMiN-small	HeteroGraphSAGE	Claim Classification Macro-F1	0.5795	# 2	Compare
Node Classification	MuMiN-small	HeteroGraphSAGE	Tweet Classification Macro-F1	0.5605	# 1	Compare
Node Classification	MuMiN-small	Random	Claim Classification Macro-F1	0.4007	# 4	Compare
Node Classification	MuMiN-small	Random	Tweet Classification Macro-F1	0.3718	# 4	Compare
Node Classification	MuMiN-small	Majority class	Claim Classification Macro-F1	0.4756	# 3	Compare
Node Classification	MuMiN-small	Majority class	Tweet Classification Macro-F1	0.4877	# 3	Compare
Node Classification	MuMiN-small	LaBSE	Claim Classification Macro-F1	0.6255	# 1	Compare
Node Classification	MuMiN-small	LaBSE	Tweet Classification Macro-F1	0.5450	# 2	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

MuMiN: A Large-Scale Multilingual Multimodal Fact-Checked Misinformation Social Network Dataset

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove