Repr\'esentation du genre dans des donn\'ees open source de parole (Gender representation in open source speech resources 1 With the rise of artificial intelligence (AI) and the growing use of deep-learning architectures, the question of ethics and transparency in AI systems has become a central concern within the research community)

Avec l{'}essor de l{'}intelligence artificielle (IA) et l{'}utilisation croissante des architectures d{'}apprentissage profond, la question de l{'}{\'e}thique et de la transparence des syst{\`e}mes d{'}IA est devenue une pr{\'e}occupation centrale au sein de la communaut{\'e} de recherche. Dans cet article, nous proposons une {\'e}tude sur la repr{\'e}sentation du genre dans les ressources de parole disponibles sur la plateforme Open Speech and Language Resource. Un tout premier r{\'e}sultat est la difficult{\'e} d{'}acc{\`e}s aux informations sur le genre des locuteurs. Ensuite, nous montrons que l{'}{\'e}quilibre entre les cat{\'e}gories de genre d{\'e}pend de diverses caract{\'e}ristiques des corpus (discours {\'e}licit{\'e} ou non, t{\^a}che adress{\'e}e). En nous appuyant sur des travaux ant{\'e}rieurs, nous reprenons quelques principes concernant les m{\'e}tadonn{\'e}es dans l{'}optique d{'}assurer une meilleure transparence des syst{\`e}mes de parole construits {\`a} l{'}aide de ces corpus.

PDF Abstract
No code implementations yet. Submit your code now

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here