Alignement de s\'equences phon\'etiques pour une analyse phonologique des erreurs de transcription automatique (Phonetic sequences alignment for a phonemic analysis of automatic speech transcription errors )
La transcription automatique de la parole obtient aujourd{'}hui des performances {\'e}lev{\'e}es avec des taux d{'}erreur qui tombent facilement en dessous de 10{\%} pour une parole journalistique. Cependant, pour des conversations plus libres, ils stagnent souvent autour de 20{--}30{\%}. En fran{\c{c}}ais, une grande partie des erreurs sont dues {\`a} des confusions entre homophones n{'}impliquant pas les niveaux acousticophon{\'e}tique et phonologique. Cependant, de nombreuses erreurs peuvent s{'}expliquer par des variantes de productions non pr{\'e}vues par le syst{\`e}me. Afin de mieux comprendre quels processus phonologiques pourraient expliquer ces variantes sp{\'e}cifiques de la parole spontan{\'e}e, nous proposons une analyse des erreurs en comparant prononciations attendue (r{\'e}f{\'e}rence) et reconnue (hypoth{\`e}se) via un alignement phon{\'e}tique par programmation dynamique. Les distances locales entre paires de phon{\`e}mes appari{\'e}s correspondent au nombre de traits phon{\'e}tiques disjoints. Nos analyses permettent d{'}identifier les traits phon{\'e}tiques les plus fr{\'e}quemment impliqu{\'e}s dans les erreurs et donnent des pistes pour des interpr{\'e}tations phonologiques.
PDF Abstract