L'optimisation du plongement de mots pour le fran\ccais : une application de la classification des phrases (Optimization of Word Embeddings for French : an Application of Sentence Classification)

JEPTALNRECITAL 2018  ·  Jungyeul Park ·

Nous proposons trois nouvelles m{\'e}thodes pour construire et optimiser des plongements de mots pour le fran{\c{c}}ais. Nous utilisons les r{\'e}sultats de l{'}{\'e}tiquetage morpho-syntaxique, de la d{\'e}tection des expressions multi-mots et de la lemmatisation pour un espace vectoriel continu. Pour l{'}{\'e}valuation, nous utilisons ces vecteurs sur une t{\^a}che de classification de phrases et les comparons avec le vecteur du syst{\`e}me de base. Nous explorons {\'e}galement l{'}approche d{'}adaptation de domaine pour construire des vecteurs. Malgr{\'e} un petit nombre de vocabulaires et la petite taille du corpus d{'}apprentissage, les vecteurs sp{\'e}cialis{\'e}s par domaine obtiennent de meilleures performances que les vecteurs hors domaine.

PDF Abstract

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here