Caract\'erisation du locuteur par CNN \`a l'aide des contours d'intensit\'e et d'intonation : comparaison avec le spectrogramme (CNN speaker characterisation through prosody : spectrogram comparison )

Dans ce travail nous avons recours aux variations de f0 et d{'}intensit{\'e} de 44 locuteurs francophones {\`a} partir de s{\'e}quences de 4 secondes de parole spontan{\'e}e pour comprendre comment ces param{\`e}tres prosodiques peuvent {\^e}tre utilis{\'e}s pour caract{\'e}riser des locuteurs. Une classification automatique est effectu{\'e}e avec un r{\'e}seau de neurones convolutifs, fournissant comme r{\'e}ponse des scores de probabilit{\'e} pour chacun des 44 locuteurs mod{\'e}lis{\'e}s. Une repr{\'e}sentation par spectrogrammes a {\'e}t{\'e} utilis{\'e}e comme r{\'e}f{\'e}rence pour le m{\^e}me syst{\`e}me de classification. Nous avons pu mettre en avant la pertinence de l{'}intensit{\'e}, et lorsque les deux param{\`e}tres prosodiques sont combin{\'e}s pour repr{\'e}senter les locuteurs nous observons un score qui atteint en moyenne 59 {\%} de bonnes classifications.

PDF Abstract
No code implementations yet. Submit your code now

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here