Impact de la structure logique des documents sur les mod\`eles distributionnels : exp\'erimentations sur le corpus TALN (Impact of document structure on distributional semantics models: a case study on NLP research articles )

Nous pr{\'e}sentons une exp{\'e}rience visant {\`a} mesurer en quoi la structure logique d{'}un document impacte les repr{\'e}sentations lexicales dans les mod{\`e}les de s{\'e}mantique distributionnelle. En nous basant sur des documents structur{\'e}s (articles de recherche en TAL) nous comparons des mod{\`e}les construits sur des corpus obtenus par suppression de certaines parties des textes du corpus : titres de section, r{\'e}sum{\'e}s, introductions et conclusions. Nous montrons que malgr{\'e} des diff{\'e}rences selon les parties et le lexique pris en compte, ces zones r{\'e}put{\'e}es particuli{\`e}rement informatives du contenu d{'}un article ont un impact globalement moins significatif que le reste du texte sur la construction du mod{\`e}le.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here