Articles

L’efficacité des logiciels de traduction automatique : mythe ou réalité? -

Par Thot , le 06 mars 2000 | Dernière mise à jour de l'article le 12 décembre 2008

L’ Université de tous les savoirs est un événement qui a été lancé en l’an 2000 et que Thot a déjà commenté en janvier. Ce projet d’envergure offre au grand public l’occasion d’assister à une conférence chaque jour de l’année sur des sujets d’ordres scientifique et technique. Ces exposés ont lieu au Conservatoire des arts et métiers à Paris et sont également accessibles sur Internet.

Dans le cadre des conférences de l’UTLS, Laurence Danlos a présenté un exposé fort éclairant sur la linguistique informatique, un domaine scientifique relativement récent qui a pour objectif d’élaborer de nouveaux systèmes de traitement automatique du langage naturel.

Elle fait un bilan portant sur les systèmes existants et leurs contraintes, ainsi que sur les perspectives d’avenir. Elle dresse un historique des premiers logiciels de traduction et traite des prototypes développés dans les laboratoires de recherche. Plusieurs exemples vous permettront de constater que les ambiguïtés de langage à surmonter en traduction sont énormes.

Sa présentation nous a permis d’y voir un peu clair sur les aspects à considérer dans l’évaluation d’un logiciel de traduction automatique.

D’abord, il faut faire une distinction entre deux types d’applications : le logiciel de traduction automatique (TA) et le logiciel de traduction assistée par ordinateur (TAO). Le premier type de logiciel est celui que l’on trouve abondamment sur le marché. Le logiciel de TA présente un sérieux inconvénient qui vient du fait que l’ordinateur manipule le texte sans en comprendre le sens. Si l’on s’en tient à la notion de mot à mot, la traduction automatique est apparemment simple. Les contraintes surviennent lorsqu’il est question de traduire des expressions composées. Prenons, par exemple, l’expression "pomme de terre". Le logiciel qui traduit mot à mot fournira la traduction suivante : "apple of the earth".

Il faut donc que le logiciel puisse intégrer une liste des expressions composées. À titre d’exemple, l’auteure cite la base de données multilingue d’ Eurodicautom de la Commission européenne, un logiciel qui compte plus d’un million de termes, incluant les expressions composées. Bien que cette base de données ne couvre pas tous les domaines de la connaissance, elle vaut certainement le détour. De plus, son accès est offert gratuitement sur Internet.

Par ailleurs, le logiciel de TAO présente un avantage important, celui de comprendre le texte à traduire. Pour qu’un ordinateur comprenne le langage, il doit être capable de calculer une représentation sémantique du texte écrit ou du discours oral. C’est donc une nette amélioration comparativement au logiciel de TA; mais, à ce jour, il existe très peu de logiciels de ce type. De plus, ces logiciels ne s’appliquent qu’à des domaines restreints et présentent leurs propres limites en raison des ambiguïtés de la langue. À cet effet, de nombreuses recherches ont été menées dans le domaine des analyseurs morphologiques et et laissent présager des résultats prometteurs.

La présentation est tout à fait instructive et mérite d’être consultée. Les exemples de traduction inadéquate vous feront rire; vous en saurez aussi un peu plus sur l’ampleur de la problématique à résoudre dans ce domaine. Laurence Danlos termine sa conférence sur une note optimiste : "L’évolution de la linguistique informatique est lente, mais elle progresse et continuera de progresser lentement mais sûrement. Peut-être bien qu’en l’an 3001, il existera des humanoïdes capables de comprendre le langage et d’éprouver des sentiments!"

ConférenceBase de données EurodicautomMode d’emploi d’Eurodicautom

Avez-vous apprécié cette page?

Voir plus d'articles de cet auteur

Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez des infolettres sur :

De plus, indexez vos ressources préférées dans vos propres dossiers et retrouvez votre historique de consultation.

M’abonner
Je suis déja abonné