Annotation automatique des types de discours dans des livres audio en vue d'une oralisation par un syst\`eme de synth\`ese (Automatic annotation of discourse types in audio-books)

Pour synth{\'e}tiser automatiquement et de mani{\`e}re expressive des livres audio, il est n{\'e}cessaire de conna{\^\i}tre le type des discours {\`a} oraliser. Ceci {\'e}tant, dans un roman ou une nouvelle, les perspectives narratives et les types de discours {\'e}voluent souvent entre de la narration, du r{\'e}citatif, du discours direct, du discours rapport{\'e}, voire des dialogues. Dans ce travail, nous allons pr{\'e}senter un outil qui a {\'e}t{\'e} d{\'e}velopp{\'e} {\`a} partir de l{'}analyse d{'}un corpus de livres audio (extraits de Madame Bovary et des Myst{\`e}res de Paris) et qui prend comme unit{\'e} de base pour l{'}analyse le paragraphe. Cet outil permet donc non seulement de d{\'e}terminer automatiquement les types de discours (narration, discours direct, dialogue), et donc de savoir qui parle, mais {\'e}galement d{'}annoter l{'}extension des modifications discursives. Ce dernier point est important, notamment dans le cas d{'}incises de citation o{\`u} le narrateur reprend la parole dans une s{\'e}quence au discours direct. Dans sa forme actuelle, l{'}outil atteint un taux de 89 {\%} de bonne d{\'e}tection.

PDF Abstract
No code implementations yet. Submit your code now

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here