\'Evaluation de mesures d'association pour les bigrammes et les trigrammes au moyen du test exact de Fisher (Using Fisher's Exact Test to Evaluate Association Measures for Bigrams and Trigrams)
Pour d{\'e}terminer si certaines mesures d{'}association lexicale fr{\'e}quemment employ{\'e}es en TAL attribuent des scores {\'e}lev{\'e}s {\`a} des n-grammes que le hasard aurait pu produire aussi souvent qu{'}observ{\'e}, nous avons utilis{\'e} une extension du test exact de Fisher {\`a} des s{\'e}quences de plus de deux mots. Les analyses ont port{\'e} sur un corpus de quatre millions de mots d{'}anglais conversationnel extrait du BNC. Les r{\'e}sultats, bas{\'e}s sur la courbe pr{\'e}cision-rappel et sur la pr{\'e}cision moyenne, montrent que le LL-simple est extr{\^e}mement efficace. IM3 est plus efficace que les autres mesures bas{\'e}es sur les tests d{'}hypoth{\`e}se et atteint m{\^e}me un niveau de performance presque {\'e}gal {\`a} LL-simple pour les trigrammes.
PDF Abstract