Des repr\'esentations continues de mots pour l'analyse d'opinions en arabe: une \'etude qualitative (Word embeddings for Arabic sentiment analysis : a qualitative study)

JEPTALNRECITAL 2018 · Amira Barhoumi, Nathalie Camelin, Yannick Est{\`e}ve ·

Nous nous int{\'e}ressons, dans cet article, {\`a} la d{\'e}tection d{'}opinions dans la langue arabe. Ces derni{\`e}res ann{\'e}es, l{'}utilisation de l{'}apprentissage profond a am{\'e}lior{\'e} des performances de nombreux syst{\`e}mes automatiques dans une grande vari{\'e}t{\'e} de domaines (analyse d{'}images, reconnaissance de la parole, traduction automatique, . . .) et {\'e}galement celui de l{'}analyse d{'}opinions en anglais. Ainsi, nous avons {\'e}tudi{\'e} l{'}apport de deux architectures (CNN et LSTM) dans notre cadre sp{\'e}cifique. Nous avons {\'e}galement test{\'e} et compar{\'e} plusieurs types de repr{\'e}sentations continues de mots (embeddings) disponibles en langue arabe, qui ont permis d{'}obtenir de bons r{\'e}sultats. Nous avons analys{\'e} les erreurs de notre syst{\`e}me et la pertinence de ces embeddings. Cette analyse m{\`e}ne {\`a} plusieurs perspectives int{\'e}ressantes de travail, au sujet notamment de la constitution automatique de ressources expert et d{'}une construction pertinente des embeddings sp{\'e}cifiques {\`a} la t{\^a}che d{'}analyse d{'}opinions.

PDF Abstract