Une m\'ethode non-supervis\'ee pour la segmentation morphologique et l'apprentissage de morphotactique \`a l'aide de processus de Pitman-Yor (An unsupervised method for joint morphological segmentation and morphotactics learning using Pitman-Yor processes)

JEPTALNRECITAL 2016  ·  Kevin L{\"o}ser, Alex Allauzen, re ·

Cet article pr{\'e}sente un mod{\`e}le bay{\'e}sien non-param{\'e}trique pour la segmentation morphologique non supervis{\'e}e. Ce mod{\`e}le semi-markovien s{'}appuie sur des classes latentes de morph{\`e}mes afin de mod{\'e}liser les caract{\'e}ristiques morphotactiques du lexique, et son caract{\`e}re non-param{\'e}trique lui permet de s{'}adapter aux donn{\'e}es sans avoir {\`a} sp{\'e}cifier {\`a} l{'}avance l{'}inventaire des morph{\`e}mes ainsi que leurs classes. Un processus de Pitman-Yor est utilis{\'e} comme a priori sur les param{\`e}tres afin d{'}{\'e}viter une convergence vers des solutions d{\'e}g{\'e}n{\'e}r{\'e}es et inadapt{\'e}es au traitemement automatique des langues. Les r{\'e}sultats exp{\'e}rimentaux montrent la pertinence des segmentations obtenues pour le turc et l{'}anglais. Une {\'e}tude qualitative montre {\'e}galement que le mod{\`e}le inf{\`e}re une morphotactique linguistiquement pertinente, sans le recours {\`a} des connaissances expertes quant {\`a} la structure morphologique des formes de mots.

PDF Abstract
No code implementations yet. Submit your code now

Datasets


  Add Datasets introduced or used in this paper

Results from the Paper


  Submit results from this paper to get state-of-the-art GitHub badges and help the community compare results to other papers.

Methods


No methods listed for this paper. Add relevant methods here