TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Linguistic Acceptability	CoLA	RemBERT	MCC	0.6	# 3
Linguistic Acceptability	ItaCoLA	mBERT	MCC	0.36	# 4
Linguistic Acceptability	ItaCoLA	XLM-R	MCC	0.52	# 2
Linguistic Acceptability	RuCoLA	XLM-R	Accuracy	61.13	# 7
Linguistic Acceptability	RuCoLA	XLM-R	MCC	0.13	# 9
Linguistic Acceptability	RuCoLA	ruT5	Accuracy	68.41	# 6
Linguistic Acceptability	RuCoLA	ruT5	MCC	0.25	# 7
Linguistic Acceptability	RuCoLA	ruRoBERTa	Accuracy	79.34	# 3
Linguistic Acceptability	RuCoLA	ruRoBERTa	MCC	0.53	# 2
Linguistic Acceptability	RuCoLA	ruBERT	Accuracy	74.3	# 5
Linguistic Acceptability	RuCoLA	ruBERT	MCC	0.42	# 5
Linguistic Acceptability	RuCoLA	ruGPT-3	Accuracy	53.82	# 8
Linguistic Acceptability	RuCoLA	ruGPT-3	MCC	0.30	# 6
Linguistic Acceptability	RuCoLA	mBERT	MCC	0.15	# 8
Linguistic Acceptability	RuCoLA	RemBERT	Accuracy	75.06	# 4
Linguistic Acceptability	RuCoLA	RemBERT	MCC	0.44	# 4

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/rucola-russian-corpus-of-linguistic/linguistic-acceptability-on-itacola)](https://paperswithcode.com/sota/linguistic-acceptability-on-itacola?p=rucola-russian-corpus-of-linguistic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/rucola-russian-corpus-of-linguistic/linguistic-acceptability-on-rucola)](https://paperswithcode.com/sota/linguistic-acceptability-on-rucola?p=rucola-russian-corpus-of-linguistic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/rucola-russian-corpus-of-linguistic/linguistic-acceptability-on-cola)](https://paperswithcode.com/sota/linguistic-acceptability-on-cola?p=rucola-russian-corpus-of-linguistic)`

RuCoLA: Russian Corpus of Linguistic Acceptability

23 Oct 2022 · Vladislav Mikhailov, Tatiana Shamardina, Max Ryabinin, Alena Pestova, Ivan Smurov, Ekaterina Artemova ·

Linguistic acceptability (LA) attracts the attention of the research community due to its many uses, such as testing the grammatical knowledge of language models and filtering implausible texts with acceptability classifiers. However, the application scope of LA in languages other than English is limited due to the lack of high-quality resources. To this end, we introduce the Russian Corpus of Linguistic Acceptability (RuCoLA), built from the ground up under the well-established binary LA approach. RuCoLA consists of $9.8$k in-domain sentences from linguistic publications and $3.6$k out-of-domain sentences produced by generative models. The out-of-domain set is created to facilitate the practical use of acceptability for improving language generation. Our paper describes the data collection protocol and presents a fine-grained analysis of acceptability classification experiments with a range of baseline approaches. In particular, we demonstrate that the most widely used language models still fall behind humans by a large margin, especially when detecting morphological and semantic errors. We release RuCoLA, the code of experiments, and a public leaderboard (rucola-benchmark.com) to assess the linguistic competence of language models for Russian.

PDF Abstract

Code

Add Remove Mark official

russiannlp/rucola official

Tasks

Add Remove

Linguistic Acceptability

Text Generation

Datasets

Introduced in the Paper:

RuCoLA

Used in the Paper:

GLUE

CoLA

WikiMatrix ItaCoLA

Results from the Paper

Edit

Ranked #2 on Linguistic Acceptability on ItaCoLA

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Linguistic Acceptability	CoLA	RemBERT	MCC	0.6	# 3	Compare
Linguistic Acceptability	ItaCoLA	mBERT	MCC	0.36	# 4	Compare
Linguistic Acceptability	ItaCoLA	XLM-R	MCC	0.52	# 2	Compare
Linguistic Acceptability	RuCoLA	XLM-R	Accuracy	61.13	# 7	Compare
Linguistic Acceptability	RuCoLA	XLM-R	MCC	0.13	# 9	Compare
Linguistic Acceptability	RuCoLA	ruT5	Accuracy	68.41	# 6	Compare
Linguistic Acceptability	RuCoLA	ruT5	MCC	0.25	# 7	Compare
Linguistic Acceptability	RuCoLA	ruRoBERTa	Accuracy	79.34	# 3	Compare
Linguistic Acceptability	RuCoLA	ruRoBERTa	MCC	0.53	# 2	Compare
Linguistic Acceptability	RuCoLA	ruBERT	Accuracy	74.3	# 5	Compare
Linguistic Acceptability	RuCoLA	ruBERT	MCC	0.42	# 5	Compare
Linguistic Acceptability	RuCoLA	ruGPT-3	Accuracy	53.82	# 8	Compare
Linguistic Acceptability	RuCoLA	ruGPT-3	MCC	0.30	# 6	Compare
Linguistic Acceptability	RuCoLA	mBERT	MCC	0.15	# 8	Compare
Linguistic Acceptability	RuCoLA	RemBERT	Accuracy	75.06	# 4	Compare
Linguistic Acceptability	RuCoLA	RemBERT	MCC	0.44	# 4	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

RuCoLA: Russian Corpus of Linguistic Acceptability

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove