Alignement de s\'equences phon\'etiques pour une analyse phonologique des erreurs de transcription automatique (Phonetic sequences alignment for a phonemic analysis of automatic speech transcription errors )

La transcription automatique de la parole obtient aujourd{'}hui des performances {\'e}lev{\'e}es avec des taux d{'}erreur qui tombent facilement en dessous de 10{\%} pour une parole journalistique. Cependant, pour des conversations plus libres, ils stagnent souvent autour de 20{--}30{\%}. En fran{\c{c}}ais, une grande partie des erreurs sont dues {\`a} des confusions entre homophones n{'}impliquant pas les niveaux acousticophon{\'e}tique et phonologique. Cependant, de nombreuses erreurs peuvent s{'}expliquer par des variantes de productions non pr{\'e}vues par le syst{\`e}me. Afin de mieux comprendre quels processus phonologiques pourraient expliquer ces variantes sp{\'e}cifiques de la parole spontan{\'e}e, nous proposons une analyse des erreurs en comparant prononciations attendue (r{\'e}f{\'e}rence) et reconnue (hypoth{\`e}se) via un alignement phon{\'e}tique par programmation dynamique. Les distances locales entre paires de phon{\`e}mes appari{\'e}s correspondent au nombre de traits phon{\'e}tiques disjoints. Nos analyses permettent d{'}identifier les traits phon{\'e}tiques les plus fr{\'e}quemment impliqu{\'e}s dans les erreurs et donnent des pistes pour des interpr{\'e}tations phonologiques.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here