Apprentissage en ligne interactif d'un g\'en\'erateur en langage naturel neuronal pour le dialogue homme-machine (On-line Interactive Learning of Natural Language Neural Generation for Human-machine)

R{\'e}cemment, de nouveaux mod{\`e}les {\`a} base de r{\'e}seaux de neurones r{\'e}currents ont {\'e}t{\'e} propos{\'e}s pour traiter la g{\'e}n{\'e}ration en langage naturel dans des syst{\`e}mes de dialogue (Wen et al., 2016a). Ces mod{\`e}les demandent une grande quantit{\'e} de donn{\'e}es d{'}apprentissage ; or la collecte et l{'}annotation de ces donn{\'e}es peuvent {\^e}tre laborieuses. Pour r{\'e}pondre {\`a} cette probl{\'e}matique, nous nous int{\'e}ressons ici {\`a} la mise en place d{'}un protocole d{'}apprentissage en ligne bas{\'e} sur un apprentissage par renforcement, permettant d{'}am{\'e}liorer l{'}utilisation d{'}un mod{\`e}le initial appris sur un corpus plus restreint g{\'e}n{\'e}r{\'e} par patrons. Dans cette {\'e}tude exploratoire, nous proposons une approche bas{\'e}e sur un algorithme de bandit contre un adversaire, afin d{'}en {\'e}tudier l{'}int{\'e}r{\^e}t et les limites.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here