Extraction automatique de relations s\'emantiques dans les d\'e finitions : approche hybride, construction d'un corpus de relations s\'emantiques pour le fran\ccais
Cet article pr{\'e}sente une exp{\'e}rimentation visant {\`a} construire une ressource s{\'e}mantique pour le fran{\c{c}}ais contemporain {\`a} partir d{'}un corpus d{'}environ un million de d{\'e}finitions tir{\'e}es de deux ressources lexicographiques (Tr{\'e}sor de la Langue Fran{\c{c}}aise, Wiktionary) et d{'}une ressource encyclop{\'e}dique (Wikipedia). L{'}objectif est d{'}extraire automatiquement dans les d{\'e}finitions diff{\'e}rentes relations s{\'e}mantiques : hyperonymie, synonymie, m{\'e}ronymie, autres relations s{\'e}mantiques. La m{\'e}thode suivie combine la pr{\'e}cision des patrons lexico-syntaxiques et le rappel des m{\'e}thodes statistiques, ainsi qu{'}un traitement in{\'e}dit de canonisation et de d{\'e}composition des {\'e}nonc{\'e}s. Apr{\`e}s avoir pr{\'e}sent{\'e} les diff{\'e}rentes approches et r{\'e}alisations existantes, nous d{\'e}taillons l{'}architecture du syst{\`e}me et pr{\'e}sentons les r{\'e}sultats : environ 900 000 relations d{'}hyperonymie et pr{\`e}s de 100 000 relations de synonymie, avec un taux de pr{\'e}cision sup{\'e}rieur {\`a} 90{\%} sur un {\'e}chantillon al{\'e}atoire de 500 relations. Plus de 2 millions de pr{\'e}dications d{\'e}finitoires ont {\'e}galement {\'e}t{\'e} extraites.
PDF Abstract