Repr\'esentation s\'emantique distributionnelle et alignement de conversations par chat (Distributional semantic representation and alignment of online chat conversations )
Les mesures de similarit{\'e} textuelle ont une place importante en TAL, du fait de leurs nombreuses applications, en recherche d{'}information et en classification notamment. En revanche, le dialogue fait moins l{'}objet d{'}attention sur cette question. Nous nous int{\'e}ressons ici {\`a} la production d{'}une similarit{\'e} dans le contexte d{'}un corpus de conversations par chat {\`a} l{'}aide de m{\'e}thodes non-supervis{\'e}es, exploitant {\`a} diff{\'e}rents niveaux la notion de s{\'e}mantique distributionnelle, sous forme d{'}embeddings. Dans un m{\^e}me temps, pour enrichir la mesure, et permettre une meilleure interpr{\'e}tation des r{\'e}sultats, nous {\'e}tablissons des alignements explicites des tours de parole dans les conversations, en exploitant la distance de Wasserstein, qui permet de prendre en compte leur dimension structurelle. Enfin, nous {\'e}valuons notre approche {\`a} l{'}aide d{'}une t{\^a}che externe sur la petite partie annot{\'e}e du corpus, et observons qu{'}elle donne de meilleurs r{\'e}sultats qu{'}une variante plus na{\"\i}ve {\`a} base de moyennes.
PDF Abstract