Identification des unit\'es de mesure dans les textes scientifiques

Le travail pr{\'e}sent{\'e} dans cet article se situe dans le cadre de l{'}identification de termes sp{\'e}cialis{\'e}s (unit{\'e}s de mesure) {\`a} partir de donn{\'e}es textuelles pour enrichir une Ressource Termino-Ontologique (RTO). La premi{\`e}re {\'e}tape de notre m{\'e}thode consiste {\`a} pr{\'e}dire la localisation des variants d{'}unit{\'e}s de mesure dans les documents. Nous avons utilis{\'e} une m{\'e}thode reposant sur l{'}apprentissage supervis{\'e}. Cette m{\'e}thode permet de r{\'e}duire sensiblement l{'}espace de recherche des variants tout en restant dans un contexte optimal de recherche (r{\'e}duction de 86{\%} de l{'}espace de recherch{\'e} sur le corpus {\'e}tudi{\'e}). La deuxi{\`e}me {\'e}tape du processus, une fois l{'}espace de recherche r{\'e}duit aux variants d{'}unit{\'e}s, utilise une nouvelle mesure de similarit{\'e} permettant d{'}identifier automatiquement les variants d{\'e}couverts par rapport {\`a} un terme d{'}unit{\'e} d{\'e}j{\`a} r{\'e}f{\'e}renc{\'e} dans la RTO avec un taux de pr{\'e}cision de 82{\%} pour un seuil au dessus de 0.6 sur le corpus {\'e}tudi{\'e}.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here