Mod\'elisation unifi\'ee du document et de son domaine pour une indexation par termes-cl\'es libre et contr\^ol\'ee (Unified document and domain-specific model for keyphrase extraction and assignment )
Dans cet article, nous nous int{\'e}ressons {\`a} l{'}indexation de documents de domaines de sp{\'e}cialit{\'e} par l{'}interm{\'e}diaire de leurs termes-cl{\'e}s. Plus particuli{\`e}rement, nous nous int{\'e}ressons {\`a} l{'}indexation telle qu{'}elle est r{\'e}alis{\'e}e par les documentalistes de biblioth{\`e}ques num{\'e}riques. Apr{\`e}s analyse de la m{\'e}thodologie de ces indexeurs professionnels, nous proposons une m{\'e}thode {\`a} base de graphe combinant les informations pr{\'e}sentes dans le document et la connaissance du domaine pour r{\'e}aliser une indexation (hybride) libre et contr{\^o}l{\'e}e. Notre m{\'e}thode permet de proposer des termes-cl{\'e}s ne se trouvant pas n{\'e}cessairement dans le document. Nos exp{\'e}riences montrent aussi que notre m{\'e}thode surpasse significativement l{'}approche {\`a} base de graphe {\'e}tat de l{'}art.
PDF Abstract