Cr\'eation rapide et efficace d'un syst\`eme de d\'esambigu\"\isation lexicale pour une langue peu dot\'ee

Nous pr{\'e}sentons une m{\'e}thode pour cr{\'e}er rapidement un syst{\`e}me de d{\'e}sambigu{\"\i}sation lexicale (DL) pour une langue L peu dot{\'e}e pourvu que l{'}on dispose d{'}un syst{\`e}me de traduction automatique statistique (TAS) d{'}une langue riche en corpus annot{\'e}s en sens (ici l{'}anglais) vers L. Il est, en effet, plus facile de disposer des ressources n{\'e}cessaires {\`a} la cr{\'e}ation d{'}un syst{\`e}me de TAS que des ressources d{\'e}di{\'e}es n{\'e}cessaires {\`a} la cr{\'e}ation d{'}un syst{\`e}me de DL pour la langue L. Notre m{\'e}thode consiste {\`a} traduire automatiquement un corpus annot{\'e} en sens vers la langue L, puis de cr{\'e}er le syst{\`e}me de d{\'e}sambigu{\"\i}sation pour L par des m{\'e}thodes supervis{\'e}es classiques. Nous montrons la faisabilit{\'e} de la m{\'e}thode et sa g{\'e}n{\'e}ricit{\'e} en traduisant le SemCor, un corpus en anglais annot{\'e} gr{\^a}ce au Princeton WordNet, de l{'}anglais vers le bangla et de l{'}anglais vers le fran{\c{c}}ais. Nous montrons la validit{\'e} de l{'}approche en {\'e}valuant les r{\'e}sultats sur la t{\^a}che de d{\'e}sambigu{\"\i}sation lexicale multilingue de Semeval 2013.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here