Construction automatique d'une base de donn\'ees \'etymologiques \`a partir du wiktionary (Automatic construction of an etymological database using Wiktionary)

JEPTALNRECITAL 2017 · Beno{\^\i}t Sagot ·

Les ressources lexicales {\'e}lectroniques ne contiennent quasiment jamais d{'}informations {\'e}tymologiques. De telles informations, convenablement formalis{\'e}es, permettraient pourtant de d{\'e}velopper des outils automatiques au service de la linguistique historique et comparative, ainsi que d{'}am{\'e}liorer significativement le traitement automatique de langues anciennes. Nous d{\'e}crivons ici le processus que nous avons mis en {\oe}uvre pour extraire des donn{\'e}es {\'e}tymologiques {\`a} partir des notices {\'e}tymologiques du wiktionary, r{\'e}dig{\'e}es en anglais. Nous avons ainsi produit une base multilingue de pr{\`e}s d{'}un million de lex{\`e}mes et une base de plus d{'}un demi-million de relations {\'e}tymologiques entre lex{\`e}mes.

PDF Abstract

Code

Add Remove Mark official

No code implementations yet. Submit your code now

Tasks

Add Remove

Datasets

Add Datasets introduced or used in this paper

Results from the Paper

Add Remove

Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Construction automatique d'une base de donn\'ees \'etymologiques \`a partir du wiktionary (Automatic construction of an etymological database using Wiktionary)

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove