\'Etiquetage en parties du discours de langues peu dot\'ees par sp\'ecialisation des plongements lexicaux (POS tagging for low-resource languages by adapting word embeddings )

Cet article pr{\'e}sente une nouvelle m{\'e}thode d{'}{\'e}tiquetage en parties du discours adapt{\'e}e aux langues peu dot{\'e}es : la d{\'e}finition du contexte utilis{\'e} pour construire les plongements lexicaux est adapt{\'e}e {\`a} la t{\^a}che, et de nouveaux vecteurs sont cr{\'e}{\'e}s pour les mots inconnus. Les exp{\'e}riences men{\'e}es sur le picard, le malgache et l{'}alsacien montrent que cette m{\'e}thode am{\'e}liore l{'}{\'e}tat de l{'}art pour ces trois langues peu dot{\'e}es.

PDF Abstract

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here