2 dataset results for Named Entity Recognition (NER) AND Finnish

WikiANN, also known as PAN-X, is a multilingual named entity recognition dataset. It consists of Wikipedia articles that have been annotated with LOC (location), PER (person), and ORG (organization) tags in the IOB2 format¹². This dataset serves as a valuable resource for training and evaluating named entity recognition models across various languages.

58 PAPERS • 3 BENCHMARKS

Finer

Finer (Finnish News Corpus for Named Entity Recognition)

Finnish News Corpus for Named Entity Recognition (Finer) is a corpus that consists of 953 articles (193,742 word tokens) with six named entity classes (organization, location, person, product, event,and date). The articles are extracted from the archives of Digitoday, a Finnish online technology news source.

4 PAPERS • NO BENCHMARKS YET

Datasets

2 dataset results for Named Entity Recognition (NER) AND Finnish