Une m\'ethode non-supervis\'ee pour la segmentation morphologique et l'apprentissage de morphotactique \`a l'aide de processus de Pitman-Yor (An unsupervised method for joint morphological segmentation and morphotactics learning using Pitman-Yor processes)
Cet article pr{\'e}sente un mod{\`e}le bay{\'e}sien non-param{\'e}trique pour la segmentation morphologique non supervis{\'e}e. Ce mod{\`e}le semi-markovien s{'}appuie sur des classes latentes de morph{\`e}mes afin de mod{\'e}liser les caract{\'e}ristiques morphotactiques du lexique, et son caract{\`e}re non-param{\'e}trique lui permet de s{'}adapter aux donn{\'e}es sans avoir {\`a} sp{\'e}cifier {\`a} l{'}avance l{'}inventaire des morph{\`e}mes ainsi que leurs classes. Un processus de Pitman-Yor est utilis{\'e} comme a priori sur les param{\`e}tres afin d{'}{\'e}viter une convergence vers des solutions d{\'e}g{\'e}n{\'e}r{\'e}es et inadapt{\'e}es au traitemement automatique des langues. Les r{\'e}sultats exp{\'e}rimentaux montrent la pertinence des segmentations obtenues pour le turc et l{'}anglais. Une {\'e}tude qualitative montre {\'e}galement que le mod{\`e}le inf{\`e}re une morphotactique linguistiquement pertinente, sans le recours {\`a} des connaissances expertes quant {\`a} la structure morphologique des formes de mots.
PDF Abstract