Comment arpenter sans m\`etre : les scores de r\'esolution de cha\^\ines de cor\'ef\'erences sont-ils des m\'etriques ? (Do the standard scores of evaluation of coreference resolution constitute metrics ?)

JEPTALNRECITAL 2020 · Adam Lion-Bouton, Lo{\"\i}c Grobol, Jean-Yves Antoine, Sylvie Billot, Ana{\"\i}s Lefeuvre-Halftermeyer ·

Cet article pr{\'e}sente un travail qui consiste {\`a} {\'e}tudier si les scores les plus utilis{\'e}s pour l{'}{\'e}valuation de la r{\'e}solution des cor{\'e}f{\'e}rences constituent des m{\'e}triques de similarit{\'e} normalis{\'e}es. En adoptant une d{\'e}marche purement exp{\'e}rimentale, nous avons v{\'e}rifi{\'e} si les scores MUC, B3 , CEAF, BLANC, LEA et le meta-score CoNLL respectent les bonnes propri{\'e}t{\'e}s qui d{\'e}finissent une telle m{\'e}trique. Notre {\'e}tude montre que seul le score CEAFm est potentiellement une m{\'e}trique de similarit{\'e} normalis{\'e}e.

PDF Abstract