Annotation automatique des types de discours dans des livres audio en vue d'une oralisation par un syst\`eme de synth\`ese (Automatic annotation of discourse types in audio-books)
Pour synth{\'e}tiser automatiquement et de mani{\`e}re expressive des livres audio, il est n{\'e}cessaire de conna{\^\i}tre le type des discours {\`a} oraliser. Ceci {\'e}tant, dans un roman ou une nouvelle, les perspectives narratives et les types de discours {\'e}voluent souvent entre de la narration, du r{\'e}citatif, du discours direct, du discours rapport{\'e}, voire des dialogues. Dans ce travail, nous allons pr{\'e}senter un outil qui a {\'e}t{\'e} d{\'e}velopp{\'e} {\`a} partir de l{'}analyse d{'}un corpus de livres audio (extraits de Madame Bovary et des Myst{\`e}res de Paris) et qui prend comme unit{\'e} de base pour l{'}analyse le paragraphe. Cet outil permet donc non seulement de d{\'e}terminer automatiquement les types de discours (narration, discours direct, dialogue), et donc de savoir qui parle, mais {\'e}galement d{'}annoter l{'}extension des modifications discursives. Ce dernier point est important, notamment dans le cas d{'}incises de citation o{\`u} le narrateur reprend la parole dans une s{\'e}quence au discours direct. Dans sa forme actuelle, l{'}outil atteint un taux de 89 {\%} de bonne d{\'e}tection.
PDF Abstract