Curriculum d'apprentissage : reconnaissance d'entit\'es nomm\'ees pour l'extraction de concepts s\'emantiques (Curriculum learning : named entity recognition for semantic concept extraction)

Dans cet article, nous pr{\'e}sentons une approche de bout en bout d{'}extraction de concepts s{\'e}mantiques de la parole. En particulier, nous mettons en avant l{'}apport d{'}une cha{\^\i}ne d{'}apprentissage successif pilot{\'e}e par une strat{\'e}gie de curriculum d{'}apprentissage. Dans la cha{\^\i}ne d{'}apprentissage mise en place, nous exploitons des donn{\'e}es fran{\c{c}}aises annot{\'e}es en entit{\'e}s nomm{\'e}es que nous supposons {\^e}tre des concepts plus g{\'e}n{\'e}riques que les concepts s{\'e}mantiques li{\'e}s {\`a} une application informatique sp{\'e}cifique. Dans cette {\'e}tude, il s{'}agit d{'}extraire des concepts s{\'e}mantiques dans le cadre de la t{\^a}che MEDIA. Pour renforcer le syst{\`e}me propos{\'e}, nous exploitons aussi des strat{\'e}gies d{'}augmentation de donn{\'e}es, un mod{\`e}le de langage 5-gramme, ainsi qu{'}un mode {\'e}toile aidant le syst{\`e}me {\`a} se concentrer sur les concepts et leurs valeurs lors de l{'}apprentissage. Les r{\'e}sultats montrent un int{\'e}r{\^e}t {\`a} l{'}utilisation des donn{\'e}es d{'}entit{\'e}s nomm{\'e}es, permettant un gain relatif allant jusqu{'}{\`a} 6,5 {\%}.

PDF Abstract

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here