D\'etection et classification non supervis\'ees de relations s\'emantiques dans des articles scientifiques (Unsupervised Classification of Semantic Relations in Scientific Papers)
Dans cet article, nous abordons une t{\^a}che encore peu explor{\'e}e, consistant {\`a} extraire automatiquement l{'}{\'e}tat de l{'}art d{'}un domaine scientifique {\`a} partir de l{'}analyse d{'}articles de ce domaine. Nous la ramenons {\`a} deux sous-t{\^a}ches {\'e}l{\'e}mentaires : l{'}identification de concepts et la reconnaissance de relations entre ces concepts. Une extraction terminologique permet d{'}identifier les concepts candidats, qui sont ensuite align{\'e}s {\`a} des ressources externes. Dans un deuxi{\`e}me temps, nous cherchons {\`a} reconna{\^\i}tre et classifier automatiquement les relations s{\'e}mantiques entre concepts de mani{\`e}re nonsupervis{\'e}e, en nous appuyant sur diff{\'e}rentes techniques de clustering et de biclustering. Nous mettons en {\oe}uvre ces deux {\'e}tapes dans un corpus extrait de l{'}archive de l{'}ACL Anthology. Une analyse manuelle nous a permis de proposer une typologie des relations s{\'e}mantiques, et de classifier un {\'e}chantillon d{'}instances de relations. Les premi{\`e}res {\'e}valuations sugg{\`e}rent l{'}int{\'e}r{\^e}t du biclustering pour d{\'e}tecter de nouveaux types de relations dans le corpus.
PDF Abstract