Construction automatique d'une base de donn\'ees \'etymologiques \`a partir du wiktionary (Automatic construction of an etymological database using Wiktionary)
Les ressources lexicales {\'e}lectroniques ne contiennent quasiment jamais d{'}informations {\'e}tymologiques. De telles informations, convenablement formalis{\'e}es, permettraient pourtant de d{\'e}velopper des outils automatiques au service de la linguistique historique et comparative, ainsi que d{'}am{\'e}liorer significativement le traitement automatique de langues anciennes. Nous d{\'e}crivons ici le processus que nous avons mis en {\oe}uvre pour extraire des donn{\'e}es {\'e}tymologiques {\`a} partir des notices {\'e}tymologiques du wiktionary, r{\'e}dig{\'e}es en anglais. Nous avons ainsi produit une base multilingue de pr{\`e}s d{'}un million de lex{\`e}mes et une base de plus d{'}un demi-million de relations {\'e}tymologiques entre lex{\`e}mes.
PDF Abstract