Impact de la structure logique des documents sur les mod\`eles distributionnels : exp\'erimentations sur le corpus TALN (Impact of document structure on distributional semantics models: a case study on NLP research articles )
Nous pr{\'e}sentons une exp{\'e}rience visant {\`a} mesurer en quoi la structure logique d{'}un document impacte les repr{\'e}sentations lexicales dans les mod{\`e}les de s{\'e}mantique distributionnelle. En nous basant sur des documents structur{\'e}s (articles de recherche en TAL) nous comparons des mod{\`e}les construits sur des corpus obtenus par suppression de certaines parties des textes du corpus : titres de section, r{\'e}sum{\'e}s, introductions et conclusions. Nous montrons que malgr{\'e} des diff{\'e}rences selon les parties et le lexique pris en compte, ces zones r{\'e}put{\'e}es particuli{\`e}rement informatives du contenu d{'}un article ont un impact globalement moins significatif que le reste du texte sur la construction du mod{\`e}le.
PDF Abstract