Extraction de th\`emes d'un corpus de demandes de support pour un logiciel de relation citoyen (Topic extraction from a corpus of support requests for citizen relations software)
Nous nous int{\'e}ressons dans cet article {\`a} l{'}extraction de th{\`e}mes (topics) {\`a} partir de commentaires textuels provenant des demandes de support de l{'}{\'e}diteur de logiciel Berger-Levrault. Le corpus de demandes analys{\'e} est celui d{'}un outil de gestion de la relation citoyen. Ce corpus n{'}est pas format{\'e} et est peu structur{\'e} avec plusieurs locuteurs qui interviennent (le citoyen et un ou plusieurs techniciens support). Nous d{\'e}crivons une {\'e}tude exp{\'e}rimentale qui repose sur l{'}utilisation de deux syst{\`e}mes. Le premier syst{\`e}me applique une LDA (Allocation Dirichlet Latente), tandis que le second combine l{'}application d{'}une LDA avec l{'}algorithme k-Moyennes (k-Means). Nous comparons nos r{\'e}sultats avec un {\'e}chantillon de ce corpus, annot{\'e} par un expert du domaine. Nos r{\'e}sultats montrent que nous obtenons une classification de meilleure qualit{\'e} comparable avec celle effectu{\'e}e manuellement par un expert en utilisant une combinaison LDA/k-Moyennes.
PDF Abstract