Projection Interlingue d'\'Etiquettes pour l'Annotation S\'emantique Non Supervis\'ee (Cross-lingual Annotation Projection for Unsupervised Semantic Tagging)
Nos travaux portent sur la construction rapide d{'}outils d{'}analyse linguistique pour des langues peu dot{\'e}es en ressources. Dans une pr{\'e}c{\'e}dente contribution, nous avons propos{\'e} une m{\'e}thode pour la construction automatique d{'}un analyseur morpho-syntaxique via une projection interlingue d{'}annotations linguistiques {\`a} partir de corpus parall{\`e}les (m{\'e}thode fond{\'e}e sur les r{\'e}seaux de neurones r{\'e}currents). Nous pr{\'e}sentons, dans cet article, une am{\'e}lioration de notre mod{\`e}le neuronal, avec la prise en compte d{'}informations linguistiques externes pour un annotateur plus complexe. En particulier, nous proposons d{'}int{\'e}grer des annotations morpho-syntaxiques dans notre architecture neuronale pour l{'}apprentissage non supervis{\'e} d{'}annotateurs s{\'e}mantiques multilingues {\`a} gros grain (annotation en SuperSenses). Nous montrons la validit{\'e} de notre m{\'e}thode et sa g{\'e}n{\'e}ricit{\'e} sur l{'}italien et le fran{\c{c}}ais et {\'e}tudions aussi l{'}impact de la qualit{\'e} du corpus parall{\`e}le sur notre approche (g{\'e}n{\'e}r{\'e} par traduction manuelle ou automatique). Nos exp{\'e}riences portent sur la projection d{'}annotations de l{'}anglais vers le fran{\c{c}}ais et l{'}italien.
PDF Abstract