Utilisation des repr\'esentations continues des mots et des param\`etres prosodiques pour la d\'etection d'erreurs dans les transcriptions automatiques de la parole (Combining continuous word representation and prosodic features for ASR error detection)

R{\'e}cemment, l{'}utilisation des repr{\'e}sentations continues de mots a connu beaucoup de succ{\`e}s dans plusieurs t{\^a}ches de traitement du langage naturel. Dans cet article, nous proposons d{'}{\'e}tudier leur utilisation dans une architecture neuronale pour la t{\^a}che de d{\'e}tection des erreurs au sein de transcriptions automatiques de la parole. Nous avons {\'e}galement exp{\'e}riment{\'e} et {\'e}valu{\'e} l{'}utilisation de param{\`e}tres prosodiques en suppl{\'e}ments des param{\`e}tres classiques (lexicaux, syntaxiques, . . .). La principale contribution de cet article porte sur la combinaison de diff{\'e}rentes repr{\'e}sentations continues de mots : plusieurs approches de combinaison sont propos{\'e}es et {\'e}valu{\'e}es afin de tirer profit de leurs compl{\'e}mentarit{\'e}s. Les exp{\'e}riences sont effectu{\'e}es sur des transcriptions automatiques du corpus ETAPE g{\'e}n{\'e}r{\'e}es par le syst{\`e}me de reconnaissance automatique du LIUM. Les r{\'e}sultats obtenus sont meilleurs que ceux d{'}un syst{\`e}me {\'e}tat de l{'}art bas{\'e} sur les champs al{\'e}atoires conditionnels. Pour terminer, nous montrons que la mesure de confiance produite est particuli{\`e}rement bien calibr{\'e}e selon une {\'e}valuation en terme d{'}Entropie Crois{\'e}e Normalis{\'e}e (NCE).

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here