Quel type de syst\`emes utiliser pour la transcription automatique du fran\ccais ? Les HMM font de la r\'esistance (What system for the automatic transcription of French in audiovisual broadcasts ?)

Forts d{'}une utilisation couronn{\'e}e de succ{\`e}s en traduction automatique, les syst{\`e}mes end-to-end dont la sortie r{\'e}side en une suite de caract{\`e}res, ont vu leur utilisation {\'e}tendue {\`a} la transcription automatique de la parole. De nombreuses comparaisons ont alors {\'e}t{\'e} effectu{\'e}es sur des corpus anglais libres de droits, de parole lue. Nous proposons ici de r{\'e}aliser une comparaison entre deux syst{\`e}mes {\'e}tat de l{'}art, non pas sur de la parole lue mais bel et bien sur un corpus d{'}{\'e}missions audiovisuelles fran{\c{c}}aises pr{\'e}sentant diff{\'e}rents degr{\'e}s de spontan{\'e}it{\'e}. Le premier est un end-to-end et le second est un syst{\`e}me hybride (HMM/DNN). L{'}obtention de r{\'e}sultats satisfaisants pour le end-to-end n{\'e}cessitant un lexique et mod{\`e}le de langage d{\'e}di{\'e}s, il est int{\'e}ressant de constater qu{'}une meilleure int{\'e}gration dans les syst{\`e}mes hybrides (HMM/DNN) est source de performances sup{\'e}rieures, notamment en Fran{\c{c}}ais o{\`u} le contexte est primordial pour capturer un {\'e}nonc{\'e}.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here