L'optimisation du plongement de mots pour le fran\ccais : une application de la classification des phrases (Optimization of Word Embeddings for French : an Application of Sentence Classification)
Nous proposons trois nouvelles m{\'e}thodes pour construire et optimiser des plongements de mots pour le fran{\c{c}}ais. Nous utilisons les r{\'e}sultats de l{'}{\'e}tiquetage morpho-syntaxique, de la d{\'e}tection des expressions multi-mots et de la lemmatisation pour un espace vectoriel continu. Pour l{'}{\'e}valuation, nous utilisons ces vecteurs sur une t{\^a}che de classification de phrases et les comparons avec le vecteur du syst{\`e}me de base. Nous explorons {\'e}galement l{'}approche d{'}adaptation de domaine pour construire des vecteurs. Malgr{\'e} un petit nombre de vocabulaires et la petite taille du corpus d{'}apprentissage, les vecteurs sp{\'e}cialis{\'e}s par domaine obtiennent de meilleures performances que les vecteurs hors domaine.
PDF Abstract