\'Evaluation de mesures d'association pour les bigrammes et les trigrammes au moyen du test exact de Fisher (Using Fisher's Exact Test to Evaluate Association Measures for Bigrams and Trigrams)

JEPTALNRECITAL 2017  ·  Yves Bestgen ·

Pour d{\'e}terminer si certaines mesures d{'}association lexicale fr{\'e}quemment employ{\'e}es en TAL attribuent des scores {\'e}lev{\'e}s {\`a} des n-grammes que le hasard aurait pu produire aussi souvent qu{'}observ{\'e}, nous avons utilis{\'e} une extension du test exact de Fisher {\`a} des s{\'e}quences de plus de deux mots. Les analyses ont port{\'e} sur un corpus de quatre millions de mots d{'}anglais conversationnel extrait du BNC. Les r{\'e}sultats, bas{\'e}s sur la courbe pr{\'e}cision-rappel et sur la pr{\'e}cision moyenne, montrent que le LL-simple est extr{\^e}mement efficace. IM3 est plus efficace que les autres mesures bas{\'e}es sur les tests d{'}hypoth{\`e}se et atteint m{\^e}me un niveau de performance presque {\'e}gal {\`a} LL-simple pour les trigrammes.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here