Extraction de th\`emes d'un corpus de demandes de support pour un logiciel de relation citoyen (Topic extraction from a corpus of support requests for citizen relations software)

Nous nous int{\'e}ressons dans cet article {\`a} l{'}extraction de th{\`e}mes (topics) {\`a} partir de commentaires textuels provenant des demandes de support de l{'}{\'e}diteur de logiciel Berger-Levrault. Le corpus de demandes analys{\'e} est celui d{'}un outil de gestion de la relation citoyen. Ce corpus n{'}est pas format{\'e} et est peu structur{\'e} avec plusieurs locuteurs qui interviennent (le citoyen et un ou plusieurs techniciens support). Nous d{\'e}crivons une {\'e}tude exp{\'e}rimentale qui repose sur l{'}utilisation de deux syst{\`e}mes. Le premier syst{\`e}me applique une LDA (Allocation Dirichlet Latente), tandis que le second combine l{'}application d{'}une LDA avec l{'}algorithme k-Moyennes (k-Means). Nous comparons nos r{\'e}sultats avec un {\'e}chantillon de ce corpus, annot{\'e} par un expert du domaine. Nos r{\'e}sultats montrent que nous obtenons une classification de meilleure qualit{\'e} comparable avec celle effectu{\'e}e manuellement par un expert en utilisant une combinaison LDA/k-Moyennes.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods