Fouille de motifs et CRF pour la reconnaissance de sympt\^omes dans les textes biom\'edicaux (Pattern mining and CRF for symptoms recognition in biomedical texts)
Dans cet article, nous nous int{\'e}ressons {\`a} l{'}extraction d{'}entit{\'e}s m{\'e}dicales de type sympt{\^o}me dans les textes biom{\'e}dicaux. Cette t{\^a}che est peu explor{\'e}e dans la litt{\'e}rature et il n{'}existe pas {\`a} notre connaissance de corpus annot{\'e} pour entra{\^\i}ner un mod{\`e}le d{'}apprentissage. Nous proposons deux approches faiblement supervis{\'e}es pour extraire ces entit{\'e}s. Une premi{\`e}re est fond{\'e}e sur la fouille de motifs et introduit une nouvelle contrainte de similarit{\'e} s{\'e}mantique. La seconde formule la tache comme une tache d{'}{\'e}tiquetage de s{\'e}quences en utilisant les CRF (champs conditionnels al{\'e}atoires). Nous d{\'e}crivons les exp{\'e}rimentations men{\'e}es qui montrent que les deux approches sont compl{\'e}mentaires en termes d{'}{\'e}valuation quantitative (rappel et pr{\'e}cision). Nous montrons en outre que leur combinaison am{\'e}liore sensiblement les r{\'e}sultats.
PDF Abstract