Adaptation par enrichissement terminologique en traduction automatique statistique fond\'ee sur la g\'en\'eration et le filtrage de bi-segments virtuels

Nous pr{\'e}sentons des travaux pr{\'e}liminaires sur une approche permettant d{'}ajouter des termes bilingues {\`a} un syst{\`e}me de Traduction Automatique Statistique (TAS) {\`a} base de segments. Les termes sont non seulement inclus individuellement, mais aussi avec des contextes les englobant. Tout d{'}abord nous g{\'e}n{\'e}rons ces contextes en g{\'e}n{\'e}ralisant des motifs (ou patrons) observ{\'e}s pour des mots de m{\^e}me nature syntaxique dans un corpus bilingue. Enfin, nous filtrons les contextes qui n{'}atteignent pas un certain seuil de confiance, {\`a} l{'}aide d{'}une m{\'e}thode de s{\'e}lection de bi-segments inspir{\'e}e d{'}une approche de s{\'e}lection de donn{\'e}es, pr{\'e}c{\'e}demment appliqu{\'e}e {\`a} des textes bilingues align{\'e}s.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here