Kor-Lang8 (Lang-8 Korean Corpus)

Introduced by Yoon et al. in Towards standardizing Korean Grammatical Error Correction: Datasets and Annotation

Kor-Lang8 is a Korean grammatical error correction (GEC) dataset extracted from the NAIST Lang-8 Learner Corpora by the language label. It contains more than 109K sentence pairs.

Source: Towards standardizing Korean Grammatical Error Correction: Datasets and Annotation

Homepage

Benchmarks

Add a new result Link an existing benchmark

No benchmarks yet. Start a new benchmark or link an existing one.

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

No data loaders found. You can submit your data loader here.

Tasks

Grammatical Error Correction

Similar Datasets

Kor-Native

Kor-Learner

Source: https://arxiv.org/pdf/2210.14389v2.pdf.

Usage

License

Unknown

Modalities

Texts

Languages

Korean

Kor-Lang8 (Lang-8 Korean Corpus)

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit