Une nouvelle mesure de la r\'everb\'eration pour pr\'edire les performances a priori de la transcription de la parole (A new reverberation measure to predict a priori ASR performance)

Dans cette {\'e}tude, nous explorons la pr{\'e}diction a priori de la qualit{\'e} de la transcription automatique de la parole dans le cas de la parole r{\'e}verb{\'e}r{\'e}e enregistr{\'e}e avec un seul microphone. Cette pr{\'e}diction est faite avant le d{\'e}codage pour informer les utilisateurs de la qualit{\'e} de la transcription attendue. Dans cette {\'e}tude, nous nous concentrons uniquement sur les pertes de performance li{\'e}es {\`a} la r{\'e}verb{\'e}ration. Une nouvelle mesure de r{\'e}verb{\'e}ration appel{\'e}e « Excitation Behavior » est introduite. Cette mesure exploite le r{\'e}sidus de la pr{\'e}diction lin{\'e}aire sur les fen{\^e}tres vois{\'e}es du signal de parole. L{'}exp{\'e}rience a {\'e}t{\'e} men{\'e}e sur le corpus Wall Street Journal, r{\'e}verb{\'e}r{\'e} par des r{\'e}ponses impulsionnelles provenant du REVERB Challenge. Par rapport aux autres mesures de r{\'e}verb{\'e}ration test{\'e}es, notre mesure obtient une am{\'e}lioration relative de 20{\%} de la pr{\'e}diction du taux d{'}erreur (aussi bien au niveau des phon{\`e}mes que des mots).

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here