Comment arpenter sans m\`etre : les scores de r\'esolution de cha\^\ines de cor\'ef\'erences sont-ils des m\'etriques ? (Do the standard scores of evaluation of coreference resolution constitute metrics ?)

Cet article pr{\'e}sente un travail qui consiste {\`a} {\'e}tudier si les scores les plus utilis{\'e}s pour l{'}{\'e}valuation de la r{\'e}solution des cor{\'e}f{\'e}rences constituent des m{\'e}triques de similarit{\'e} normalis{\'e}es. En adoptant une d{\'e}marche purement exp{\'e}rimentale, nous avons v{\'e}rifi{\'e} si les scores MUC, B3 , CEAF, BLANC, LEA et le meta-score CoNLL respectent les bonnes propri{\'e}t{\'e}s qui d{\'e}finissent une telle m{\'e}trique. Notre {\'e}tude montre que seul le score CEAFm est potentiellement une m{\'e}trique de similarit{\'e} normalis{\'e}e.

PDF Abstract
No code implementations yet. Submit your code now

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here