Une p\'enalit\'e floue fond\'ee phonologiquement pour am\'eliorer la S\'election d'Unit\'e (A Phonologically Motivated Penalty To Improve Unit Selection)
Les syst{\`e}mes de synth{\`e}se par corpus reposent, sauf de rares exceptions, sur des co{\^u}ts cibles et des co{\^u}ts de concat{\'e}nation pour s{\'e}lectionner la meilleure s{\'e}quence d{'}unit{\'e}s. Le r{\^o}le du co{\^u}t de concat{\'e}nation est de s{'}assurer que l{'}assemblage de deux segments de parole ne causera l{'}apparition d{'}aucun artefact acoustique. Pour cette t{\^a}che, des distances acoustiques (MFCC, F0) sont g{\'e}n{\'e}ralement utilis{\'e}es, mais dans de nombreux cas cela ne suffit pas. Dans cet article, nous introduisons une p{\'e}nalit{\'e} h{\'e}rit{\'e}e du domaine de la couverture de corpus dans le co{\^u}t de concat{\'e}nation afin de bloquer certaines concat{\'e}nations en fonction de la classe phonologique des diphones {\`a} concat{\'e}ner. En outre, une seconde version faisant appel {\`a} une fonction floue est propos{\'e}e pour rel{\^a}cher la p{\'e}nalit{\'e} en fonction du positionnement du co{\^u}t de concat{\'e}nation par rapport {\`a} sa distribution. Une {\'e}valuation objective montre que la p{\'e}nalit{\'e} est efficace et am{\`e}ne {\`a} un meilleur classement des s{\'e}quences d{'}unit{\'e}s candidates au cours de la s{\'e}lection. Une {\'e}valuation subjective r{\'e}v{\`e}le une performance sup{\'e}rieure de l{'}approche floue.
PDF Abstract