Vers une analyse des diff\'erences interlinguistiques entre les genres textuels : \'etude de cas bas\'ee sur les n-grammes et l'analyse factorielle des correspondances (Towards a cross-linguistic analysis of genres: A case study based on n-grams and Correspondence Analysis)

L{'}objectif de notre travail est d{'}{\'e}valuer l{'}int{\'e}r{\^e}t d{'}employer les n-grammes et l{'}analyse factorielle des correspondances (AFC) pour comparer les genres textuels dans les {\'e}tudes contrastives interlinguistiques. Nous exploitons un corpus bilingue anglais-fran{\c{c}}ais constitu{\'e} de textes originaux comparables. Le corpus r{\'e}unit trois genres : les d{\'e}bats parlementaires europ{\'e}ens, les {\'e}ditoriaux de presse et les articles scientifiques. Dans un premier temps, les n-grammes d{'}une longueur de 2 {\`a} 4 mots sont extraits dans chaque langue. Ensuite, pour chaque longueur, les 1 000 n-grammes les plus fr{\'e}quents dans chaque langue sont trait{\'e}s par l{'}AFC pour d{\'e}terminer quels n-grammes sont particuli{\`e}rement saillants dans les genres {\'e}tudi{\'e}s. Enfin, les n-grammes sont cat{\'e}goris{\'e}s manuellement en distinguant les expressions d{'}opinion et de certitude, les marqueurs discursifs et les expressions r{\'e}f{\'e}rentielles. Les r{\'e}sultats montrent que les n-grammes permettent de mettre au jour des caract{\'e}ristiques typiques des genres {\'e}tudi{\'e}s, de m{\^e}me que des contrastes interlangues int{\'e}ressants.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here