Comparaison de listes d'erreurs de transcription automatique de la parole : quelle compl\'ementarit\'e entre les diff\'erentes m\'etriques ? (Comparing error lists for ASR systems : contribution of different metrics)

Le travail que nous pr{\'e}sentons ici s{'}inscrit dans le domaine de l{'}{\'e}valuation des syst{\`e}mes de reconnaissance automatique de la parole en vue de leur utilisation dans une t{\^a}che aval, ici la reconnaissance des entit{\'e}s nomm{\'e}es. Plus largement, la question que nous nous posons est {``}que peut apporter une m{\'e}trique d{'}{\'e}valuation en dehors d{'}un score ?''. Nous nous int{\'e}ressons particuli{\`e}rement aux erreurs des syst{\`e}mes et {\`a} leur analyse et {\'e}ventuellement {\`a} l{'}utilisation de ce que nous connaissons de ces erreurs. Nous {\'e}tudions dans ce travail les listes ordonn{\'e}es d{'}erreurs g{\'e}n{\'e}r{\'e}es {\`a} partir de diff{\'e}rentes m{\'e}triques et analysons ce qui en ressort. Nous avons appliqu{\'e} la m{\^e}me m{\'e}thode sur les sorties de diff{\'e}rents syst{\`e}mes de reconnaissance de la parole. Nos exp{\'e}riences mettent en {\'e}vidence que certaines m{\'e}triques apportent une information plus pertinente {\'e}tant donn{\'e} une t{\^a}che et transverse {\`a} diff{\'e}rents syst{\`e}mes.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here