Annotation d'expressions polylexicales verbales en fran\ccais (Annotation of verbal multiword expressions in French)
Nous d{\'e}crivons la partie fran{\c{c}}aise des donn{\'e}es produites dans le cadre de la campagne multilingue PARSEME sur l{'}identification d{'}expressions polylexicales verbales (Savary et al., 2017). Les expressions couvertes pour le fran{\c{c}}ais sont les expressions verbales idiomatiques, les verbes intrins{\`e}quement pronominaux et une g{\'e}n{\'e}ralisation des constructions {\`a} verbe support. Ces ph{\'e}nom{\`e}nes ont {\'e}t{\'e} annot{\'e}s sur le corpus French-UD (Nivre et al., 2016) et le corpus Sequoia (Candito {\&} Seddah, 2012), soit un corpus de 22 645 phrases, pour un total de 4 962 expressions annot{\'e}es. On obtient un ratio d{'}une expression annot{\'e}e tous les 100 tokens environ, avec un fort taux d{'}expressions discontinues (40{\%}).
PDF Abstract