...des conf\'erences enfin disons des causeries... D\'etection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux
Notre travail porte sur la d{\'e}tection automatique des segments en relation de reformulation paraphrastique dans les corpus oraux. L{'}approche propos{\'e}e est une approche syntagmatique qui tient compte des marqueurs de reformulation paraphrastique et des sp{\'e}cificit{\'e}s de l{'}oral. Les donn{\'e}es de r{\'e}f{\'e}rence sont consensuelles. Une m{\'e}thode automatique fond{\'e}e sur l{'}apprentissage avec les CRF est propos{\'e}e afin de d{\'e}tecter les segments paraphras{\'e}s. Diff{\'e}rents descripteurs sont exploit{\'e}s dans une fen{\^e}tre de taille variable. Les tests effectu{\'e}s montrent que les segments en relation de paraphrase sont assez difficiles {\`a} d{\'e}tecter, surtout avec leurs fronti{\`e}res correctes. Les meilleures moyennes atteignent 0,65 de F-mesure, 0,75 de pr{\'e}cision et 0,63 de rappel. Nous avons plusieurs perspectives {\`a} ce travail pour am{\'e}liorer la d{\'e}tection des segments en relation de paraphrase et pour {\'e}tudier les donn{\'e}es depuis d{'}autres points de vue.
PDF Abstract