Search Results for author: Yoann Dupont

Found 24 papers, 2 papers with code

QUEER@DEFT2021 : Identification du Profil Clinique de Patients et Notation Automatique de Copies d’Étudiants (QUEER@DEFT2021 : Patients Clinical Profile Identification and Automatic Student Grading )

no code implementations • JEP/TALN/RECITAL 2021 • Yoann Dupont, Carlos-Emiliano González-Gallardo, Gaël Lejeune, Alice Millour, Jean-Baptiste Tanguy

Dans la tâche d’identification de de profil clinique (tâche 1) nous présentons une méthode de recherche d’information basé sur un index dérivé du MeSH.

Paper
Add Code

French CrowS-Pairs: Extending a challenge dataset for measuring social bias in masked language models to a language other than English

no code implementations • ACL 2022 • Aurélie Névéol, Yoann Dupont, Julien Bezançon, Karën Fort

We build on the US-centered CrowS-pairs dataset to create a multilingual stereotypes dataset that allows for comparability across languages while also characterizing biases that are specific to each country and language.

Sentence

Paper
Add Code

Use of a Citizen Science Platform for the Creation of a Language Resource to Study Bias in Language Models for French: A Case Study

no code implementations • NIDCP (LREC) 2022 • Karën Fort, Aurélie Névéol, Yoann Dupont, Julien Bezançon

We created three tasks on the LanguageARC citizen science platform to assist with the translation of an existing resource from English into French as well as the collection of complementary resources in native French.

Fairness Translation

Paper
Add Code

French CrowS-Pairs: Extension à une langue autre que l’anglais d’un corpus de mesure des biais sociétaux dans les modèles de langue masqués (French CrowS-Pairs : Extending a challenge dataset for measuring social bias in masked language models to a language other than English)

no code implementations • JEP/TALN/RECITAL 2022 • Aurélie Névéol, Yoann Dupont, Julien Bezançon, Karën Fort

Nous montrons que quatre modèles de langue favorisent les énoncés qui expriment des stéréotypes dans la plupart des catégories.

Paper
Add Code

Toolbox : une chaîne de traitement de corpus pour les humanités numériques (Toolbox : a corpus processing pipeline for digital humanities)

no code implementations • JEP/TALN/RECITAL 2022 • Johanna Mayra Cordova, Yoann Dupont, Ljudmila Petkovic, James Gawley, Motasem Alrahabi, Glenn Roe

Le projet Toolbox propose une chaîne de traitement pour la manipulation et le traitement de corpus textuels incluant la numérisation (OCR/HTR), la conversion au format TEI, la fouille de texte (reconnaissance d’entités nommées) et la visualisation de données.

HTR Optical Character Recognition (OCR)

Paper
Add Code

Stylo@DEFT2022 : Notation automatique de copies d’étudiant·e·s par combinaisons de méthodes de similarité (Stylo@DEFT2022 : Automatic short answer grading by combinations of similarity methods )

no code implementations • JEP/TALN/RECITAL 2022 • Ibtihel Ben Ltaifa, Toufik Boubehziz, Andrea Briglia, Corina Chutaux, Yoann Dupont, Carlos-Emiliano González-Gallardo, Caroline Koudoro-Parfait, Gaël Lejeune

Cet article présente la participation de l’équipe STyLO (STIH, L3I, OBTIC) au DÉfi Fouille de Textes 2022 (DEFT 2022).

Sentence Sentence Embeddings

Paper
Add Code

Exploration orientée entités : étude du genre dans le Mercure de France (Entity oriented exploration : studying gender in the Mercure de France)

no code implementations • JEP/TALN/RECITAL 2022 • Yoann Dupont, Marguerite Bordry

Dans cet article, nous étudions la façon dont le genre influence les critiques littéraires et plus précisément le Mercure de France, l’une des plus importantes revues parisiennes de la fin du XIXe siècle.

Paper
Add Code

FENEC : un corpus équilibré pour l’évaluation des entités nommées en français (FENEC : a balanced sample corpus for French named entity recognition )

1 code implementation • JEP/TALN/RECITAL 2022 • Alice Millour, Yoann Dupont, Alexane Jouglar, Karën Fort

Nous présentons ici FENEC (FrEnch Named-entity Evaluation Corpus), un corpus à échantillons équilibrés contenant six genres, annoté en entités nommées selon le schéma fin Quæro.

named-entity-recognition Named Entity Recognition +1

Paper
Code

Les mod\`eles de langue contextuels Camembert pour le fran\ccais : impact de la taille et de l'h\'et\'erog\'en\'eit\'e des donn\'ees d'entrainement (C AMEM BERT Contextual Language Models for French: Impact of Training Data Size and Heterogeneity )

no code implementations • JEPTALNRECITAL 2020 • Louis Martin, Benjamin Muller, Pedro Javier Ortiz Su{\'a}rez, Yoann Dupont, Laurent Romary, {\'E}ric Villemonte de la Clergerie, Beno{\^\i}t Sagot, Djam{\'e} Seddah

L{'}utilisation pratique de ces mod{\`e}les {---} dans toutes les langues sauf l{'}anglais {---} {\'e}tait donc limit{\'e}e. La sortie r{\'e}cente de plusieurs mod{\`e}les monolingues fond{\'e}s sur BERT (Devlin et al., 2019), notamment pour le fran{\c{c}}ais, a d{\'e}montr{\'e} l{'}int{\'e}r{\^e}t de ces mod{\`e}les en am{\'e}liorant l{'}{\'e}tat de l{'}art pour toutes les t{\^a}ches {\'e}valu{\'e}es.

SENTS

Paper
Add Code

Establishing a New State-of-the-Art for French Named Entity Recognition

no code implementations • LREC 2020 • Pedro Javier Ortiz Suárez, Yoann Dupont, Benjamin Muller, Laurent Romary, Benoît Sagot

The French TreeBank developed at the University Paris 7 is the main source of morphosyntactic and syntactic annotations for French.

named-entity-recognition Named Entity Recognition +1

Paper
Add Code

CamemBERT: a Tasty French Language Model

6 code implementations • ACL 2020 • Louis Martin, Benjamin Muller, Pedro Javier Ortiz Suárez, Yoann Dupont, Laurent Romary, Éric Villemonte de la Clergerie, Djamé Seddah, Benoît Sagot

We show that the use of web crawled data is preferable to the use of Wikipedia data.

Ranked #1 on Dependency Parsing on French GSD

Dependency Parsing Language Modelling +4

124,984

Paper
Code

Un corpus libre, \'evolutif et versionn\'e en entit\'es nomm\'ees du Fran\ccais (A free, evolving and versioned french named entity recognition corpus)

no code implementations • JEPTALNRECITAL 2019 • Yoann Dupont

Les corpus annot{\'e}s sont des ressources difficiles {\`a} cr{\'e}er en raison du grand effort humain qu{'}elles impliquent.

named-entity-recognition Named Entity Recognition +1

Paper
Add Code

Un outil d'\'etiquetage rapide et un corpus libre en entit\'es nomm\'ees du Fran\ccais (A fast tagging tool and a free French named entity corpus)

no code implementations • JEPTALNRECITAL 2018 • Yoann Dupont

Dans cet article, nous pr{\'e}sentons un outil pour effectuer l{'}{\'e}tiquetage rapide de textes bruts.

NER

Paper
Add Code

Effective Spoken Language Labeling with Deep Recurrent Neural Networks

no code implementations • 20 Jun 2017 • Marco Dinarelli, Yoann Dupont, Isabelle Tellier

Understanding spoken language is a highly complex problem, which can be decomposed into several simpler tasks.

Spoken Language Understanding

Paper
Add Code

Label-Dependencies Aware Recurrent Neural Networks

no code implementations • 6 Jun 2017 • Yoann Dupont, Marco Dinarelli, Isabelle Tellier

In this work we propose a solution far simpler but very effective: an evolution of the simple Jordan RNN, where labels are re-injected as input into the network, and converted into embeddings, in the same way as words.

Spoken Language Understanding

Paper
Add Code

R\'eseaux neuronaux profonds pour l'\'etiquetage de s\'equences (Deep Neural Networks for Sequence Labeling)

no code implementations • JEPTALNRECITAL 2017 • Yoann Dupont, Marco Dinarelli, Isabelle Tellier

R{\'e}cemment, une variante de r{\'e}seau neuronal particuli{\`e}rement adapt{\'e} {\`a} l{'}{\'e}tiquetage de s{\'e}quences textuelles a {\'e}t{\'e} propos{\'e}e, utilisant des repr{\'e}sentations distributionnelles des {\'e}tiquettes.

Paper
Add Code

Exploration de traits pour la reconnaissance d'entit\'es nomm\'ees du Fran\ccais par apprentissage automatique (Feature exploration for French Named Entity Recognition with Machine Learning)

no code implementations • JEPTALNRECITAL 2017 • Yoann Dupont

Dans cet article, nous explorons divers traits propos{\'e}s dans la litt{\'e}rature afin de fournir un d{\'e}tecteur d{'}entit{\'e}s nomm{\'e}es pour le Fran{\c{c}}ais appris automatiquement sur le French Treebank.

named-entity-recognition Named Entity Recognition +1

Paper
Add Code

Un \'etiqueteur en ligne du Fran\ccais (An online tagger for French)

no code implementations • JEPTALNRECITAL 2017 • Yoann Dupont, Cl{\'e}ment Plancq

Nous proposons ici une interface en ligne pour {\'e}tiqueter des textes en fran{\c{c}}ais selon trois niveaux d{'}analyses : la morphosyntaxe, le chunking et la reconnaissance des entit{\'e}s nomm{\'e}es.

Chunking

Paper
Add Code

Construction automatis\'ee d'une base de connaissances (Automated Building a Knowledge Base)

no code implementations • JEPTALNRECITAL 2016 • Olivier Mesnard, Yoann Dupont, J{\'e}r{\'e}my Guillemot, Rashedur Rahman

Le syst{\`e}me pr{\'e}sent{\'e} permet la construction automatis{\'e}e d{'}une base de connaissances sur des personnes et des organisations {\`a} partir d{'}une collection de documents.