Repr\'esentation vectorielle de sens pour la d\'esambigu\"\isation lexicale \`a base de connaissances (Sense Embeddings in Knowledge-Based Word Sense Disambiguation)

Dans cet article, nous proposons une nouvelle m{\'e}thode pour repr{\'e}senter sous forme vectorielle les sens d{'}un dictionnaire. Nous utilisons les termes employ{\'e}s dans leur d{\'e}finition en les projetant dans un espace vectoriel, puis en additionnant les vecteurs r{\'e}sultants, avec des pond{\'e}rations d{\'e}pendantes de leur partie du discours et de leur fr{\'e}quence. Le vecteur de sens r{\'e}sultant est alors utilis{\'e} pour trouver des sens reli{\'e}s, permettant de cr{\'e}er un r{\'e}seau lexical de mani{\`e}re automatique. Le r{\'e}seau obtenu est ensuite {\'e}valu{\'e} par rapport au r{\'e}seau lexical de WordNet, construit manuellement. Pour cela nous comparons l{'}impact des diff{\'e}rents r{\'e}seaux sur un syst{\`e}me de d{\'e}sambigu{\"\i}sation lexicale bas{\'e} sur la mesure de Lesk. L{'}avantage de notre m{\'e}thode est qu{'}elle peut {\^e}tre appliqu{\'e}e {\`a} n{'}importe quelle langue ne poss{\'e}dant pas un r{\'e}seau lexical comme celui de WordNet. Les r{\'e}sultats montrent que notre r{\'e}seau automatiquement g{\'e}n{\'e}r{\'e} permet d{'}am{\'e}liorer le score du syst{\`e}me de base, atteignant quasiment la qualit{\'e} du r{\'e}seau de WordNet.

PDF Abstract

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here