Quel type de syst\`emes utiliser pour la transcription automatique du fran\ccais ? Les HMM font de la r\'esistance (What system for the automatic transcription of French in audiovisual broadcasts ?)
Forts d{'}une utilisation couronn{\'e}e de succ{\`e}s en traduction automatique, les syst{\`e}mes end-to-end dont la sortie r{\'e}side en une suite de caract{\`e}res, ont vu leur utilisation {\'e}tendue {\`a} la transcription automatique de la parole. De nombreuses comparaisons ont alors {\'e}t{\'e} effectu{\'e}es sur des corpus anglais libres de droits, de parole lue. Nous proposons ici de r{\'e}aliser une comparaison entre deux syst{\`e}mes {\'e}tat de l{'}art, non pas sur de la parole lue mais bel et bien sur un corpus d{'}{\'e}missions audiovisuelles fran{\c{c}}aises pr{\'e}sentant diff{\'e}rents degr{\'e}s de spontan{\'e}it{\'e}. Le premier est un end-to-end et le second est un syst{\`e}me hybride (HMM/DNN). L{'}obtention de r{\'e}sultats satisfaisants pour le end-to-end n{\'e}cessitant un lexique et mod{\`e}le de langage d{\'e}di{\'e}s, il est int{\'e}ressant de constater qu{'}une meilleure int{\'e}gration dans les syst{\`e}mes hybrides (HMM/DNN) est source de performances sup{\'e}rieures, notamment en Fran{\c{c}}ais o{\`u} le contexte est primordial pour capturer un {\'e}nonc{\'e}.
PDF Abstract