Une p\'enalit\'e floue fond\'ee phonologiquement pour am\'eliorer la S\'election d'Unit\'e (A Phonologically Motivated Penalty To Improve Unit Selection)

JEPTALNRECITAL 2016  ·  David Guennec, Damien Lolive ·

Les syst{\`e}mes de synth{\`e}se par corpus reposent, sauf de rares exceptions, sur des co{\^u}ts cibles et des co{\^u}ts de concat{\'e}nation pour s{\'e}lectionner la meilleure s{\'e}quence d{'}unit{\'e}s. Le r{\^o}le du co{\^u}t de concat{\'e}nation est de s{'}assurer que l{'}assemblage de deux segments de parole ne causera l{'}apparition d{'}aucun artefact acoustique. Pour cette t{\^a}che, des distances acoustiques (MFCC, F0) sont g{\'e}n{\'e}ralement utilis{\'e}es, mais dans de nombreux cas cela ne suffit pas. Dans cet article, nous introduisons une p{\'e}nalit{\'e} h{\'e}rit{\'e}e du domaine de la couverture de corpus dans le co{\^u}t de concat{\'e}nation afin de bloquer certaines concat{\'e}nations en fonction de la classe phonologique des diphones {\`a} concat{\'e}ner. En outre, une seconde version faisant appel {\`a} une fonction floue est propos{\'e}e pour rel{\^a}cher la p{\'e}nalit{\'e} en fonction du positionnement du co{\^u}t de concat{\'e}nation par rapport {\`a} sa distribution. Une {\'e}valuation objective montre que la p{\'e}nalit{\'e} est efficace et am{\`e}ne {\`a} un meilleur classement des s{\'e}quences d{'}unit{\'e}s candidates au cours de la s{\'e}lection. Une {\'e}valuation subjective r{\'e}v{\`e}le une performance sup{\'e}rieure de l{'}approche floue.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here