Annotation d'expressions polylexicales verbales en fran\ccais (Annotation of verbal multiword expressions in French)

Nous d{\'e}crivons la partie fran{\c{c}}aise des donn{\'e}es produites dans le cadre de la campagne multilingue PARSEME sur l{'}identification d{'}expressions polylexicales verbales (Savary et al., 2017). Les expressions couvertes pour le fran{\c{c}}ais sont les expressions verbales idiomatiques, les verbes intrins{\`e}quement pronominaux et une g{\'e}n{\'e}ralisation des constructions {\`a} verbe support. Ces ph{\'e}nom{\`e}nes ont {\'e}t{\'e} annot{\'e}s sur le corpus French-UD (Nivre et al., 2016) et le corpus Sequoia (Candito {\&} Seddah, 2012), soit un corpus de 22 645 phrases, pour un total de 4 962 expressions annot{\'e}es. On obtient un ratio d{'}une expression annot{\'e}e tous les 100 tokens environ, avec un fort taux d{'}expressions discontinues (40{\%}).

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here