preloader

Survol des méthodes des systèmes de traduction automatique des dialectes Arabes (section II) - tachicart

MÉTHODES EXISTANTES DE LA TRADUCTION AUTOMATIQUE

Globalement, il existe deux  stratégies fondamentales pour la réalisation d’un système de traduction. D’une part l’approche basée sur les règles repose sur une analyse morphologique en exploitant les informations linguistiques de la langue source et cible. Elle se déroule en trois phases (Figure 1) dont la première est l’analyse qui produit une série de découpages pour déterminer la structure grammaticale de chaque mot, sachant que souvent un analyseur morphologique est introduit dans cette phase. Ensuite, chaque analyse précédente est associée à une ou plusieurs analyses de la langue cible en utilisant un dictionnaire bilingue dans la phase de transfert. Enfin, un texte en langue cible est produit dans la phase génération en respectant un ordre approprié. 

 

Figure 1.  Traduction à base des règles

D’autre part, l’approche statistique considère que chaque phrase de la langue cible est une traduction d’une phrase de la langue source avec une certaine probabilité, et ce à partir de l’analyse d’un corpus parallèle par un modèle de traduction et l’analyse d’un corpus monolingue de la langue cible par un modèle de langue. Ce dernier introduit les contraintes imposées par la syntaxe de la langue cible et estime la probabilité d’une phrase de cette langue, tandis que le modèle de traduction modélise le processus de génération d’une phrase source à partir d’une phrase cible. Le résultat généré par ces deux modèles est utilisé par un décodeur qui calcule la probabilité de traduction de la phrase source vers la phrase cible en un temps acceptable (Figure 2).

 

Figure 1.  Traduction statistique

Nous identifions dans la partie suivante les étapes qui constituent le processus de la construction d’un système de traduction, et donnons des illustrations en termes de travaux, en se limitant aux dialectes arabes.