\'Evaluation dune nouvelle structuration th\'ematique hi\'erarchique des textes dans un cadre de r\'esum\'e automatique et de d\'etection d'ancres au sein de vid\'eos (Evaluation of a novel hierarchical thematic structuring of texts in the framework of text summarization and anchor detection for video hyperlinking )
automatique et de d{\'e}tection d{'}ancres au sein de vid{\'e}os Anca Simon1 Guillaume Gravier2 Pascale S{\'e}billot3 (1) Universit{\'e} de Rennes 1, IRISA {\&} INRIA Rennes, Campus de Beaulieu, 35042 Rennes, France (2) CNRS, IRISA {\&} INRIA Rennes, Campus de Beaulieu, 35042 Rennes, France (3) INSA, IRISA {\&} INRIA Rennes, Campus de Beaulieu, 35042 Rennes, France anca.simon@irisa.fr, guillaume.gravier@irisa.fr, pascale.sebillot@irisa.fr R {\'E}SUM{\'E} Dans cet article, nous {\'e}valuons, {\`a} travers son int{\'e}r{\^e}t pour le r{\'e}sum{\'e} automatique et la d{\'e}tection d{'}ancres dans des vid{\'e}os, le potentiel d{'}une nouvelle structure th{\'e}matique extraite de donn{\'e}es textuelles, compos{\'e}e d{'}une hi{\'e}rarchie de fragments th{\'e}matiquement focalis{\'e}s. Cette structure est produite par un algorithme exploitant les distributions temporelles d{'}apparition des mots dans les textes en se fondant sur une analyse de salves lexicales. La hi{\'e}rarchie obtenue a pour objet de filtrer le contenu non crucial et de ne conserver que l{'}information saillante des textes, {\`a} diff{\'e}rents niveaux de d{\'e}tail. Nous montrons qu{'}elle permet d{'}am{\'e}liorer la production de r{\'e}sum{\'e}s ou au moins de maintenir les r{\'e}sultats de l{'}{\'e}tat de l{'}art, tandis que pour la d{\'e}tection d{'}ancres, elle nous conduit {\`a} la meilleure pr{\'e}cision dans le contexte de la t{\^a}che Search and Anchoring in Video Archives {\`a} MediaEval. Les exp{\'e}riences sont r{\'e}alis{\'e}es sur du texte {\'e}crit et sur un corpus de transcriptions automatiques d{'}{\'e}missions de t{\'e}l{\'e}vision.
PDF Abstract