Identification des probl\`emes d'annotation pour l'extraction de relations (Identification of annotation problem for the relation extraction)

L{'}annotation d{'}un corpus est une t{\^a}che difficile et laborieuse, notamment sur des textes de sp{\'e}cialit{\'e} comme les textes biom{\'e}dicaux. Ainsi, dans un contexte comme l{'}extraction des interactions alimentm{\'e}dicament (FDI), l{'}annotation du corpus POMELO a {\'e}t{\'e} r{\'e}alis{\'e}e par un seul annotateur et pr{\'e}sente des risques d{'}erreur. Dans cet article, nous proposons d{'}identifier ces probl{\`e}mes d{'}annotation en utilisant un corpus Silver Standard (CSS) que nous {\'e}tablissons {\`a} partir d{'}un vote majoritaire parmi les annotations propos{\'e}es par des mod{\`e}les entra{\^\i}n{\'e}s sur un domaine similaire (interaction m{\'e}dicamentm{\'e}dicament {--} DDI) et l{'}annotation manuelle {\`a} {\'e}valuer. Les r{\'e}sultats obtenus montrent que l{'}annotation dans POMELO est consid{\'e}rablement {\'e}loign{\'e}e du CSS. L{'}analyse des erreurs permet d{'}en identifier les principales causes et de proposer des solutions pour corriger l{'}annotation existante.

PDF Abstract
No code implementations yet. Submit your code now

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here