Identification des unit\'es de mesure dans les textes scientifiques
Le travail pr{\'e}sent{\'e} dans cet article se situe dans le cadre de l{'}identification de termes sp{\'e}cialis{\'e}s (unit{\'e}s de mesure) {\`a} partir de donn{\'e}es textuelles pour enrichir une Ressource Termino-Ontologique (RTO). La premi{\`e}re {\'e}tape de notre m{\'e}thode consiste {\`a} pr{\'e}dire la localisation des variants d{'}unit{\'e}s de mesure dans les documents. Nous avons utilis{\'e} une m{\'e}thode reposant sur l{'}apprentissage supervis{\'e}. Cette m{\'e}thode permet de r{\'e}duire sensiblement l{'}espace de recherche des variants tout en restant dans un contexte optimal de recherche (r{\'e}duction de 86{\%} de l{'}espace de recherch{\'e} sur le corpus {\'e}tudi{\'e}). La deuxi{\`e}me {\'e}tape du processus, une fois l{'}espace de recherche r{\'e}duit aux variants d{'}unit{\'e}s, utilise une nouvelle mesure de similarit{\'e} permettant d{'}identifier automatiquement les variants d{\'e}couverts par rapport {\`a} un terme d{'}unit{\'e} d{\'e}j{\`a} r{\'e}f{\'e}renc{\'e} dans la RTO avec un taux de pr{\'e}cision de 82{\%} pour un seuil au dessus de 0.6 sur le corpus {\'e}tudi{\'e}.
PDF Abstract