no code implementations • JEP/TALN/RECITAL 2021 • Yoann Dupont, Carlos-Emiliano González-Gallardo, Gaël Lejeune, Alice Millour, Jean-Baptiste Tanguy
Dans la tâche d’identification de de profil clinique (tâche 1) nous présentons une méthode de recherche d’information basé sur un index dérivé du MeSH.
no code implementations • ACL 2022 • Aurélie Névéol, Yoann Dupont, Julien Bezançon, Karën Fort
We build on the US-centered CrowS-pairs dataset to create a multilingual stereotypes dataset that allows for comparability across languages while also characterizing biases that are specific to each country and language.
no code implementations • NIDCP (LREC) 2022 • Karën Fort, Aurélie Névéol, Yoann Dupont, Julien Bezançon
We created three tasks on the LanguageARC citizen science platform to assist with the translation of an existing resource from English into French as well as the collection of complementary resources in native French.
no code implementations • JEP/TALN/RECITAL 2022 • Aurélie Névéol, Yoann Dupont, Julien Bezançon, Karën Fort
Nous montrons que quatre modèles de langue favorisent les énoncés qui expriment des stéréotypes dans la plupart des catégories.
no code implementations • JEP/TALN/RECITAL 2022 • Johanna Mayra Cordova, Yoann Dupont, Ljudmila Petkovic, James Gawley, Motasem Alrahabi, Glenn Roe
Le projet Toolbox propose une chaîne de traitement pour la manipulation et le traitement de corpus textuels incluant la numérisation (OCR/HTR), la conversion au format TEI, la fouille de texte (reconnaissance d’entités nommées) et la visualisation de données.
no code implementations • JEP/TALN/RECITAL 2022 • Ibtihel Ben Ltaifa, Toufik Boubehziz, Andrea Briglia, Corina Chutaux, Yoann Dupont, Carlos-Emiliano González-Gallardo, Caroline Koudoro-Parfait, Gaël Lejeune
Cet article présente la participation de l’équipe STyLO (STIH, L3I, OBTIC) au DÉfi Fouille de Textes 2022 (DEFT 2022).
no code implementations • JEP/TALN/RECITAL 2022 • Yoann Dupont, Marguerite Bordry
Dans cet article, nous étudions la façon dont le genre influence les critiques littéraires et plus précisément le Mercure de France, l’une des plus importantes revues parisiennes de la fin du XIXe siècle.
1 code implementation • JEP/TALN/RECITAL 2022 • Alice Millour, Yoann Dupont, Alexane Jouglar, Karën Fort
Nous présentons ici FENEC (FrEnch Named-entity Evaluation Corpus), un corpus à échantillons équilibrés contenant six genres, annoté en entités nommées selon le schéma fin Quæro.
no code implementations • JEPTALNRECITAL 2020 • Louis Martin, Benjamin Muller, Pedro Javier Ortiz Su{\'a}rez, Yoann Dupont, Laurent Romary, {\'E}ric Villemonte de la Clergerie, Beno{\^\i}t Sagot, Djam{\'e} Seddah
L{'}utilisation pratique de ces mod{\`e}les {---} dans toutes les langues sauf l{'}anglais {---} {\'e}tait donc limit{\'e}e. La sortie r{\'e}cente de plusieurs mod{\`e}les monolingues fond{\'e}s sur BERT (Devlin et al., 2019), notamment pour le fran{\c{c}}ais, a d{\'e}montr{\'e} l{'}int{\'e}r{\^e}t de ces mod{\`e}les en am{\'e}liorant l{'}{\'e}tat de l{'}art pour toutes les t{\^a}ches {\'e}valu{\'e}es.
no code implementations • LREC 2020 • Pedro Javier Ortiz Suárez, Yoann Dupont, Benjamin Muller, Laurent Romary, Benoît Sagot
The French TreeBank developed at the University Paris 7 is the main source of morphosyntactic and syntactic annotations for French.
6 code implementations • ACL 2020 • Louis Martin, Benjamin Muller, Pedro Javier Ortiz Suárez, Yoann Dupont, Laurent Romary, Éric Villemonte de la Clergerie, Djamé Seddah, Benoît Sagot
We show that the use of web crawled data is preferable to the use of Wikipedia data.
Ranked #1 on Dependency Parsing on French GSD
no code implementations • JEPTALNRECITAL 2019 • Yoann Dupont
Les corpus annot{\'e}s sont des ressources difficiles {\`a} cr{\'e}er en raison du grand effort humain qu{'}elles impliquent.
no code implementations • JEPTALNRECITAL 2018 • Yoann Dupont
Dans cet article, nous pr{\'e}sentons un outil pour effectuer l{'}{\'e}tiquetage rapide de textes bruts.
no code implementations • 20 Jun 2017 • Marco Dinarelli, Yoann Dupont, Isabelle Tellier
Understanding spoken language is a highly complex problem, which can be decomposed into several simpler tasks.
no code implementations • 6 Jun 2017 • Yoann Dupont, Marco Dinarelli, Isabelle Tellier
In this work we propose a solution far simpler but very effective: an evolution of the simple Jordan RNN, where labels are re-injected as input into the network, and converted into embeddings, in the same way as words.
no code implementations • JEPTALNRECITAL 2017 • Yoann Dupont, Marco Dinarelli, Isabelle Tellier
R{\'e}cemment, une variante de r{\'e}seau neuronal particuli{\`e}rement adapt{\'e} {\`a} l{'}{\'e}tiquetage de s{\'e}quences textuelles a {\'e}t{\'e} propos{\'e}e, utilisant des repr{\'e}sentations distributionnelles des {\'e}tiquettes.
no code implementations • JEPTALNRECITAL 2017 • Yoann Dupont
Dans cet article, nous explorons divers traits propos{\'e}s dans la litt{\'e}rature afin de fournir un d{\'e}tecteur d{'}entit{\'e}s nomm{\'e}es pour le Fran{\c{c}}ais appris automatiquement sur le French Treebank.
no code implementations • JEPTALNRECITAL 2017 • Yoann Dupont, Cl{\'e}ment Plancq
Nous proposons ici une interface en ligne pour {\'e}tiqueter des textes en fran{\c{c}}ais selon trois niveaux d{'}analyses : la morphosyntaxe, le chunking et la reconnaissance des entit{\'e}s nomm{\'e}es.
no code implementations • JEPTALNRECITAL 2016 • Olivier Mesnard, Yoann Dupont, J{\'e}r{\'e}my Guillemot, Rashedur Rahman
Le syst{\`e}me pr{\'e}sent{\'e} permet la construction automatis{\'e}e d{'}une base de connaissances sur des personnes et des organisations {\`a} partir d{'}une collection de documents.