Ajout automatique de disfluences pour la synth\`ese de la parole spontan\'ee : formalisation et preuve de concept (Automatic disfluency insertion towards spontaneous TTS : formalization and proof of concept)
Cet article pr{\'e}sente un travail exploratoire sur l{'}ajout automatique de disfluences, c{'}est-{\`a}-dire de pauses, de r{\'e}p{\'e}titions et de r{\'e}visions, dans les {\'e}nonc{\'e}s en entr{\'e}e d{'}un syst{\`e}me de synth{\`e}se de la parole. L{'}objectif est de conf{\'e}rer aux signaux ainsi synth{\'e}tis{\'e}s un caract{\`e}re plus spontan{\'e} et expressif. Pour cela, nous pr{\'e}sentons une formalisation novatrice du processus de production de disfluences {\`a} travers un m{\'e}canisme de composition de ces disfluences. Cette formalisation se distingue notamment des approches visant la d{\'e}tection ou le nettoyage de disfluences dans des transcriptions, ou de celles en synth{\`e}se de la parole qui ne s{'}int{\'e}ressent qu{'}au seul ajout de pauses. Nous pr{\'e}sentons une premi{\`e}re impl{\'e}mentation de notre processus fond{\'e}e sur des champs al{\'e}atoires conditionnels et des mod{\`e}les de langage, puis conduisons des {\'e}valuations objectives et perceptives. Celles-ci nous permettent de conclure {\`a} la fonctionnalit{\'e} de notre proposition et d{'}en discuter les pistes principales d{'}am{\'e}lioration.
PDF Abstract