Caract\'erisation du locuteur par CNN \`a l'aide des contours d'intensit\'e et d'intonation : comparaison avec le spectrogramme (CNN speaker characterisation through prosody : spectrogram comparison )
Dans ce travail nous avons recours aux variations de f0 et d{'}intensit{\'e} de 44 locuteurs francophones {\`a} partir de s{\'e}quences de 4 secondes de parole spontan{\'e}e pour comprendre comment ces param{\`e}tres prosodiques peuvent {\^e}tre utilis{\'e}s pour caract{\'e}riser des locuteurs. Une classification automatique est effectu{\'e}e avec un r{\'e}seau de neurones convolutifs, fournissant comme r{\'e}ponse des scores de probabilit{\'e} pour chacun des 44 locuteurs mod{\'e}lis{\'e}s. Une repr{\'e}sentation par spectrogrammes a {\'e}t{\'e} utilis{\'e}e comme r{\'e}f{\'e}rence pour le m{\^e}me syst{\`e}me de classification. Nous avons pu mettre en avant la pertinence de l{'}intensit{\'e}, et lorsque les deux param{\`e}tres prosodiques sont combin{\'e}s pour repr{\'e}senter les locuteurs nous observons un score qui atteint en moyenne 59 {\%} de bonnes classifications.
PDF Abstract