Analyse syntaxique de l'ancien fran\ccais : quelles propri\'et\'es de la langue influent le plus sur la qualit\'e de l'apprentissage ?
L{'}article pr{\'e}sente des r{\'e}sultats d{'}exp{\'e}riences d{'}apprentissage automatique pour l{'}{\'e}tiquetage morpho-syntaxique et l{'}analyse syntaxique en d{\'e}pendance de l{'}ancien fran{\c{c}}ais. Ces exp{\'e}riences ont pour objectif de servir une exploration de corpus pour laquelle le corpus arbor{\'e} SRCMF sert de donn{\'e}es de r{\'e}f{\'e}rence. La nature peu standardis{\'e}e de la langue qui y est utilis{\'e}e implique des donn{\'e}es d{'}entra{\^\i}nement h{\'e}t{\'e}rog{\`e}nes et quantitativement limit{\'e}es. Nous explorons donc diverses strat{\'e}gies, fond{\'e}es sur diff{\'e}rents crit{\`e}res (variabilit{\'e} du lexique, forme Vers/Prose des textes, dates des textes), pour constituer des corpus d{'}entrainement menant aux meilleurs r{\'e}sultats possibles.
PDF Abstract