Compr\'ehension automatique de la parole sans donn\'ees de r\'ef\'erence

La majorit{\'e} des m{\'e}thodes {\'e}tat de l{'}art en compr{\'e}hension automatique de la parole ont en commun de devoir {\^e}tre apprises sur une grande quantit{\'e} de donn{\'e}es annot{\'e}es. Cette d{\'e}pendance aux donn{\'e}es constitue un r{\'e}el obstacle lors du d{\'e}veloppement d{'}un syst{\`e}me pour une nouvelle t{\^a}che/langue. Aussi, dans cette {\'e}tude, nous pr{\'e}sentons une m{\'e}thode visant {\`a} limiter ce besoin par un m{\'e}canisme d{'}apprentissage sans donn{\'e}es de r{\'e}f{\'e}rence (zero-shot learning). Cette m{\'e}thode combine une description ontologique minimale de la t{\^a}che vis{\'e}e avec l{'}utilisation d{'}un espace s{\'e}mantique continu appris par des approches {\`a} base de r{\'e}seaux de neurones {\`a} partir de donn{\'e}es g{\'e}n{\'e}riques non-annot{\'e}es. Nous montrons que le mod{\`e}le simple et peu co{\^u}teux obtenu peut atteindre, d{\`e}s le d{\'e}marrage, des performances comparables {\`a} celles des syst{\`e}mes {\'e}tat de l{'}art reposant sur des r{\`e}gles expertes ou sur des approches probabilistes sur des t{\^a}ches de compr{\'e}hension de la parole de r{\'e}f{\'e}rence (tests des Dialog State Tracking Challenges, DSTC2 et DSTC3). Nous proposons ensuite une strat{\'e}gie d{'}adaptation en ligne permettant d{'}am{\'e}liorer encore les performances de notre approche {\`a} l{'}aide d{'}une supervision faible et ajustable par l{'}utilisateur.

PDF Abstract

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here