no code implementations • RANLP 2021 • Hee-Soo Choi, Bruno Guillaume, Karën Fort, Guy Perrier
This paper details experiments we performed on the Universal Dependencies 2. 7 corpora in order to investigate the dominant word order in the available languages.
1 code implementation • JEP/TALN/RECITAL 2022 • Alice Millour, Yoann Dupont, Alexane Jouglar, Karën Fort
Nous présentons ici FENEC (FrEnch Named-entity Evaluation Corpus), un corpus à échantillons équilibrés contenant six genres, annoté en entités nommées selon le schéma fin Quæro.
no code implementations • JEP/TALN/RECITAL 2022 • Fanny Ducel, Karën Fort, Gaël Lejeune, Yves Lepage
Cet article étudie l’application de la #RègledeBender dans des articles de traitement automatique des langues (TAL), en prenant en compte une dimension contrastive, par l’examen des actes de deux conférences du domaine, TALN et ACL, et une dimension diachronique, en examinant ces conférences au fil du temps.
no code implementations • JEP/TALN/RECITAL 2022 • Nicolas Hiebel, Karën Fort, Aurélie Névéol, Olivier Ferret
Le TAL repose sur la disponibilité de corpus annotés pour l’entraînement et l’évaluation de modèles.
no code implementations • JEP/TALN/RECITAL 2022 • Aurélie Névéol, Yoann Dupont, Julien Bezançon, Karën Fort
Nous montrons que quatre modèles de langue favorisent les énoncés qui expriment des stéréotypes dans la plupart des catégories.
no code implementations • LREC 2022 • Fanny Ducel, Karën Fort, Gaël Lejeune, Yves Lepage
For this purpose, we created a corpus from LREC and ACL articles from the above-mentioned periods, from which we manually annotated nearly 1, 000.
no code implementations • NIDCP (LREC) 2022 • Karën Fort, Aurélie Névéol, Yoann Dupont, Julien Bezançon
We created three tasks on the LanguageARC citizen science platform to assist with the translation of an existing resource from English into French as well as the collection of complementary resources in native French.
no code implementations • LREC 2022 • Harry Bunt, Maxime Amblard, Johan Bos, Karën Fort, Bruno Guillaume, Philippe de Groote, Chuyuan Li, Pierre Ludmann, Michel Musiol, Siyana Pavlova, Guy Perrier, Sylvain Pogodalla
This paper describes the continuation of a project that aims at establishing an interoperable annotation schema for quantification phenomena as part of the ISO suite of standards for semantic annotation, known as the Semantic Annotation Framework.
no code implementations • LREC 2022 • Nicolas Hiebel, Olivier Ferret, Karën Fort, Aurélie Névéol
We introduce a definition of similarity that is guided by clinical facts and apply it to the development of a new French corpus of 1, 000 sentence pairs manually annotated according to similarity scores.
no code implementations • ACL 2022 • Aurélie Névéol, Yoann Dupont, Julien Bezançon, Karën Fort
We build on the US-centered CrowS-pairs dataset to create a multilingual stereotypes dataset that allows for comparability across languages while also characterizing biases that are specific to each country and language.
1 code implementation • 4 May 2023 • Mohamed Abdalla, Jan Philip Wahle, Terry Ruas, Aurélie Névéol, Fanny Ducel, Saif M. Mohammad, Karën Fort
Recent advances in deep learning methods for natural language processing (NLP) have created new business opportunities and made NLP research critical for industry development.