Cr\'eation rapide et efficace d'un syst\`eme de d\'esambigu\"\isation lexicale pour une langue peu dot\'ee
Nous pr{\'e}sentons une m{\'e}thode pour cr{\'e}er rapidement un syst{\`e}me de d{\'e}sambigu{\"\i}sation lexicale (DL) pour une langue L peu dot{\'e}e pourvu que l{'}on dispose d{'}un syst{\`e}me de traduction automatique statistique (TAS) d{'}une langue riche en corpus annot{\'e}s en sens (ici l{'}anglais) vers L. Il est, en effet, plus facile de disposer des ressources n{\'e}cessaires {\`a} la cr{\'e}ation d{'}un syst{\`e}me de TAS que des ressources d{\'e}di{\'e}es n{\'e}cessaires {\`a} la cr{\'e}ation d{'}un syst{\`e}me de DL pour la langue L. Notre m{\'e}thode consiste {\`a} traduire automatiquement un corpus annot{\'e} en sens vers la langue L, puis de cr{\'e}er le syst{\`e}me de d{\'e}sambigu{\"\i}sation pour L par des m{\'e}thodes supervis{\'e}es classiques. Nous montrons la faisabilit{\'e} de la m{\'e}thode et sa g{\'e}n{\'e}ricit{\'e} en traduisant le SemCor, un corpus en anglais annot{\'e} gr{\^a}ce au Princeton WordNet, de l{'}anglais vers le bangla et de l{'}anglais vers le fran{\c{c}}ais. Nous montrons la validit{\'e} de l{'}approche en {\'e}valuant les r{\'e}sultats sur la t{\^a}che de d{\'e}sambigu{\"\i}sation lexicale multilingue de Semeval 2013.
PDF Abstract