Search Results for author: Yoann Dupont

Found 24 papers, 2 papers with code

Construction automatis\'ee d'une base de connaissances (Automated Building a Knowledge Base)

no code implementations JEPTALNRECITAL 2016 Olivier Mesnard, Yoann Dupont, J{\'e}r{\'e}my Guillemot, Rashedur Rahman

Le syst{\`e}me pr{\'e}sent{\'e} permet la construction automatis{\'e}e d{'}une base de connaissances sur des personnes et des organisations {\`a} partir d{'}une collection de documents.

Exploration de traits pour la reconnaissance d'entit\'es nomm\'ees du Fran\ccais par apprentissage automatique (Feature exploration for French Named Entity Recognition with Machine Learning)

no code implementations JEPTALNRECITAL 2017 Yoann Dupont

Dans cet article, nous explorons divers traits propos{\'e}s dans la litt{\'e}rature afin de fournir un d{\'e}tecteur d{'}entit{\'e}s nomm{\'e}es pour le Fran{\c{c}}ais appris automatiquement sur le French Treebank.

named-entity-recognition Named Entity Recognition +1

R\'eseaux neuronaux profonds pour l'\'etiquetage de s\'equences (Deep Neural Networks for Sequence Labeling)

no code implementations JEPTALNRECITAL 2017 Yoann Dupont, Marco Dinarelli, Isabelle Tellier

R{\'e}cemment, une variante de r{\'e}seau neuronal particuli{\`e}rement adapt{\'e} {\`a} l{'}{\'e}tiquetage de s{\'e}quences textuelles a {\'e}t{\'e} propos{\'e}e, utilisant des repr{\'e}sentations distributionnelles des {\'e}tiquettes.

Un \'etiqueteur en ligne du Fran\ccais (An online tagger for French)

no code implementations JEPTALNRECITAL 2017 Yoann Dupont, Cl{\'e}ment Plancq

Nous proposons ici une interface en ligne pour {\'e}tiqueter des textes en fran{\c{c}}ais selon trois niveaux d{'}analyses : la morphosyntaxe, le chunking et la reconnaissance des entit{\'e}s nomm{\'e}es.

Chunking

Label-Dependencies Aware Recurrent Neural Networks

no code implementations6 Jun 2017 Yoann Dupont, Marco Dinarelli, Isabelle Tellier

In this work we propose a solution far simpler but very effective: an evolution of the simple Jordan RNN, where labels are re-injected as input into the network, and converted into embeddings, in the same way as words.

Spoken Language Understanding

Effective Spoken Language Labeling with Deep Recurrent Neural Networks

no code implementations20 Jun 2017 Marco Dinarelli, Yoann Dupont, Isabelle Tellier

Understanding spoken language is a highly complex problem, which can be decomposed into several simpler tasks.

Spoken Language Understanding

Les mod\`eles de langue contextuels Camembert pour le fran\ccais : impact de la taille et de l'h\'et\'erog\'en\'eit\'e des donn\'ees d'entrainement (C AMEM BERT Contextual Language Models for French: Impact of Training Data Size and Heterogeneity )

no code implementations JEPTALNRECITAL 2020 Louis Martin, Benjamin Muller, Pedro Javier Ortiz Su{\'a}rez, Yoann Dupont, Laurent Romary, {\'E}ric Villemonte de la Clergerie, Beno{\^\i}t Sagot, Djam{\'e} Seddah

L{'}utilisation pratique de ces mod{\`e}les {---} dans toutes les langues sauf l{'}anglais {---} {\'e}tait donc limit{\'e}e. La sortie r{\'e}cente de plusieurs mod{\`e}les monolingues fond{\'e}s sur BERT (Devlin et al., 2019), notamment pour le fran{\c{c}}ais, a d{\'e}montr{\'e} l{'}int{\'e}r{\^e}t de ces mod{\`e}les en am{\'e}liorant l{'}{\'e}tat de l{'}art pour toutes les t{\^a}ches {\'e}valu{\'e}es.

SENTS

French CrowS-Pairs: Extending a challenge dataset for measuring social bias in masked language models to a language other than English

no code implementations ACL 2022 Aurélie Névéol, Yoann Dupont, Julien Bezançon, Karën Fort

We build on the US-centered CrowS-pairs dataset to create a multilingual stereotypes dataset that allows for comparability across languages while also characterizing biases that are specific to each country and language.

Sentence

Toolbox : une chaîne de traitement de corpus pour les humanités numériques (Toolbox : a corpus processing pipeline for digital humanities)

no code implementations JEP/TALN/RECITAL 2022 Johanna Mayra Cordova, Yoann Dupont, Ljudmila Petkovic, James Gawley, Motasem Alrahabi, Glenn Roe

Le projet Toolbox propose une chaîne de traitement pour la manipulation et le traitement de corpus textuels incluant la numérisation (OCR/HTR), la conversion au format TEI, la fouille de texte (reconnaissance d’entités nommées) et la visualisation de données.

HTR Optical Character Recognition (OCR)

Exploration orientée entités : étude du genre dans le Mercure de France (Entity oriented exploration : studying gender in the Mercure de France)

no code implementations JEP/TALN/RECITAL 2022 Yoann Dupont, Marguerite Bordry

Dans cet article, nous étudions la façon dont le genre influence les critiques littéraires et plus précisément le Mercure de France, l’une des plus importantes revues parisiennes de la fin du XIXe siècle.

Use of a Citizen Science Platform for the Creation of a Language Resource to Study Bias in Language Models for French: A Case Study

no code implementations NIDCP (LREC) 2022 Karën Fort, Aurélie Névéol, Yoann Dupont, Julien Bezançon

We created three tasks on the LanguageARC citizen science platform to assist with the translation of an existing resource from English into French as well as the collection of complementary resources in native French.

Fairness Translation

Cannot find the paper you are looking for? You can Submit a new open access paper.