1 code implementation • JEP/TALN/RECITAL 2022 • Alice Millour, Yoann Dupont, Alexane Jouglar, Karën Fort
Nous présentons ici FENEC (FrEnch Named-entity Evaluation Corpus), un corpus à échantillons équilibrés contenant six genres, annoté en entités nommées selon le schéma fin Quæro.
no code implementations • JEP/TALN/RECITAL 2021 • Yoann Dupont, Carlos-Emiliano González-Gallardo, Gaël Lejeune, Alice Millour, Jean-Baptiste Tanguy
Dans la tâche d’identification de de profil clinique (tâche 1) nous présentons une méthode de recherche d’information basé sur un index dérivé du MeSH.
no code implementations • JEPTALNRECITAL 2020 • Alice Millour, Kar{\"e}n Fort, Pierre Magistry
Nous pr{\'e}sentons ici les r{\'e}sultats d{'}un travail de r{\'e}plication et d{'}extension pour l{'}alsacien d{'}une exp{\'e}rience concernant l{'}{\'e}tiquetage en parties du discours de langues peu dot{\'e}es par sp{\'e}cialisation des plongements lexicaux (Magistry et al., 2018).
no code implementations • LREC 2020 • Alice Millour, Kar{\"e}n Fort
Text corpora represent the foundation on which most natural language processing systems rely.
no code implementations • LREC 2020 • Lionel Nicolas, Verena Lyding, Claudia Borg, Corina Forascu, Kar{\"e}n Fort, Katerina Zdravkova, Iztok Kosem, Jaka {\v{C}}ibej, {\v{S}}pela Arhar Holdt, Alice Millour, Alex K{\"o}nig, er, Christos Rodosthenous, Federico Sangati, Umair ul Hassan, Anisia Katinskaia, Anabela Barreiro, Lavinia Aparaschivei, Yaakov HaCohen-Kerner
We introduce in this paper a generic approach to combine implicit crowdsourcing and language learning in order to mass-produce language resources (LRs) for any language for which a crowd of language learners can be involved.
no code implementations • RANLP 2019 • Alice Millour, Kar{\"e}n Fort
Building representative linguistic resources and NLP tools for non-standardized languages is challenging: when spelling is not determined by a norm, multiple written forms can be encountered for a given word, inducing a large proportion of out-of-vocabulary words.
no code implementations • JEPTALNRECITAL 2017 • Alice Millour, Kar{\"e}n Fort, Delphine Bernhard, Lucie Steibl{\'e}
Nous pr{\'e}sentons ici les r{\'e}sultats d{'}une exp{\'e}rience men{\'e}e sur l{'}annotation en parties du discours d{'}un corpus d{'}une langue r{\'e}gionale encore peu dot{\'e}e, l{'}alsacien, via une plateforme de myriadisation (crowdsourcing) b{\'e}n{\'e}vole d{\'e}velopp{\'e}e sp{\'e}cifiquement {\`a} cette fin : Bisame1 .