Une approche linguistique pour la d\'etection des dialectes arabes (A linguistic approach for the detection of Arabic dialects)

Dans cet article, nous pr{\'e}sentons un processus d{'}identification automatique de l{'}origine dialectale pour la langue arabe de textes {\'e}crits en caract{\`e}res arabes ou en {\'e}criture latine (arabizi). Nous d{\'e}crivons le processus d{'}annotation des ressources construites et du syst{\`e}me de translitt{\'e}ration adopt{\'e}. Deux approches d{'}identification de la langue sont compar{\'e}es : la premi{\`e}re est linguistique et exploite des dictionnaires, la seconde est statistique et repose sur des m{\'e}thodes traditionnelles d{'}apprentissage automatique (n-grammes). L{'}{\'e}valuation de ces approches montre que la m{\'e}thode linguistique donne des r{\'e}sultats satisfaisants, sans {\^e}tre d{\'e}pendante des corpus d{'}apprentissage.

PDF Abstract
No code implementations yet. Submit your code now

Tasks


Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here