Le corpus PASTEL pour le traitement automatique de cours magistraux (PASTEL corpus for automatic processing of lectures)
Le projet PASTEL {\'e}tudie l{'}acceptabilit{\'e} et l{'}utilisabilit{\'e} des transcriptions automatiques dans le cadre d{'}enseignements magistraux. Il s{'}agit d{'}outiller les apprenants pour enrichir de mani{\`e}re synchrone et automatique les informations auxquelles ils peuvent avoir acc{\`e}s durant la s{\'e}ance. Cet enrichissement s{'}appuie sur des traitements automatiques du langage naturel effectu{\'e}s sur les transcriptions automatiques. Nous pr{\'e}sentons dans cet article un travail portant sur l{'}annotation d{'}enregistrements de cours magistraux enregistr{\'e}s dans le cadre du projet CominOpenCourseware. Ces annotations visent {\`a} effectuer des exp{\'e}riences de transcription automatique, segmentation th{\'e}matique, appariement automatique en temps r{\'e}el avec des ressources externes... Ce corpus comprend plus de neuf heures de parole annot{\'e}es. Nous pr{\'e}sentons {\'e}galement des exp{\'e}riences pr{\'e}liminaires r{\'e}alis{\'e}es pour {\'e}valuer l{'}adaptation automatique de notre syst{\`e}me de reconnaissance de la parole.
PDF Abstract