Pr\'ediction automatique de fonctions pragmatiques dans les reformulations (Automatic prediction of pragmatic functions in reformulations)
La reformulation participe {\`a} la structuration du discours, notamment dans le cas des dialogues, et contribue {\'e}galement {\`a} la dynamique du discours. Reformuler est un acte significatif qui poursuit des objectifs pr{\'e}cis. L{'}objectif de notre travail est de pr{\'e}dire automatiquement la raison pour laquelle un locuteur effectue une reformulation. Nous utilisons une classification de onze fonctions pragmatiques inspir{\'e}es des travaux existants et des donn{\'e}es analys{\'e}es. Les donn{\'e}es de r{\'e}f{\'e}rence sont issues d{'}annotations manuelles et consensuelles des reformulations spontan{\'e}es form{\'e}es autour de trois marqueurs (c{'}est-{\`a}-dire, je veux dire, disons). Les donn{\'e}es proviennent d{'}un corpus oral et d{'}un corpus de discussions sur les forums de sant{\'e}. Nous exploitons des algorithmes de cat{\'e}gorisation supervis{\'e}e et un ensemble de plusieurs descripteurs (syntaxiques, formels, s{\'e}mantiques et discursifs) pour pr{\'e}dire les cat{\'e}gories de reformulation. La distribution des {\'e}nonc{\'e}s et phrases selon les cat{\'e}gories n{'}est pas homog{\`e}ne. Les exp{\'e}riences sont positionn{\'e}es {\`a} deux niveaux : g{\'e}n{\'e}rique et sp{\'e}cifique. Nos r{\'e}sultats indiquent qu{'}il est plus facile de pr{\'e}dire les types de fonctions au niveau g{\'e}n{\'e}rique (la moyenne des F-mesures est autour de 0,80), qu{'}au niveau des cat{\'e}gories individuelles (la moyenne des F-mesures est autour de 0,40). L{'}influence de diff{\'e}rents param{\`e}tres est {\'e}tudi{\'e}e.
PDF Abstract