Comment arpenter sans m\`etre : les scores de r\'esolution de cha\^\ines de cor\'ef\'erences sont-ils des m\'etriques ? (Do the standard scores of evaluation of coreference resolution constitute metrics ?)

Cet article pr{\'e}sente un travail qui consiste {\`a} {\'e}tudier si les scores les plus utilis{\'e}s pour l{'}{\'e}valuation de la r{\'e}solution des cor{\'e}f{\'e}rences constituent des m{\'e}triques de similarit{\'e} normalis{\'e}es. En adoptant une d{\'e}marche purement exp{\'e}rimentale, nous avons v{\'e}rifi{\'e} si les scores MUC, B3 , CEAF, BLANC, LEA et le meta-score CoNLL respectent les bonnes propri{\'e}t{\'e}s qui d{\'e}finissent une telle m{\'e}trique. Notre {\'e}tude montre que seul le score CEAFm est potentiellement une m{\'e}trique de similarit{\'e} normalis{\'e}e.

PDF Abstract

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here