Extraction automatique de relations s\'emantiques dans les d\'e finitions : approche hybride, construction d'un corpus de relations s\'emantiques pour le fran\ccais

JEPTALNRECITAL 2015  ·  Emmanuel Cartier ·

Cet article pr{\'e}sente une exp{\'e}rimentation visant {\`a} construire une ressource s{\'e}mantique pour le fran{\c{c}}ais contemporain {\`a} partir d{'}un corpus d{'}environ un million de d{\'e}finitions tir{\'e}es de deux ressources lexicographiques (Tr{\'e}sor de la Langue Fran{\c{c}}aise, Wiktionary) et d{'}une ressource encyclop{\'e}dique (Wikipedia). L{'}objectif est d{'}extraire automatiquement dans les d{\'e}finitions diff{\'e}rentes relations s{\'e}mantiques : hyperonymie, synonymie, m{\'e}ronymie, autres relations s{\'e}mantiques. La m{\'e}thode suivie combine la pr{\'e}cision des patrons lexico-syntaxiques et le rappel des m{\'e}thodes statistiques, ainsi qu{'}un traitement in{\'e}dit de canonisation et de d{\'e}composition des {\'e}nonc{\'e}s. Apr{\`e}s avoir pr{\'e}sent{\'e} les diff{\'e}rentes approches et r{\'e}alisations existantes, nous d{\'e}taillons l{'}architecture du syst{\`e}me et pr{\'e}sentons les r{\'e}sultats : environ 900 000 relations d{'}hyperonymie et pr{\`e}s de 100 000 relations de synonymie, avec un taux de pr{\'e}cision sup{\'e}rieur {\`a} 90{\%} sur un {\'e}chantillon al{\'e}atoire de 500 relations. Plus de 2 millions de pr{\'e}dications d{\'e}finitoires ont {\'e}galement {\'e}t{\'e} extraites.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here