À l’automne dernier, Google, Microsoft, Systran et SDL ont annoncé de nouvelles avancées en matière de « Neural Machine Translation » (NMT), à savoir, les outils automatiques modulaires en temps réel de traduction. Qu’est-ce que cela implique réellement en termes de qualité ?

Du « mot à mot » à un ensemble cohérent

Jusqu’à présent, les outils de traduction en ligne, tels que Google Translate ou SYSTRANet, utilisaient un modèle de traduction statistique ou « Statistical Machine Translation » (SMT). Les algorithmes se concentrent sur la segmentation d’unités de mots pour générer un ensemble d’hypothèses de traduction. Un système peu fiable selon le niveau de technicité d’un document et les différences linguistiques entre une langue source et une langue cible.

Similaire au fonctionnement du cerveau humain, le système de traduction automatique neuronale dite « Neural Machine Translation » (NMT) se compose d’un réseau de neurones artificiels qui se nourrit en temps réel de données enrichies. Grâce à cette méthode d’auto-apprentissage basée sur l’Intelligence Artificielle, le Big Data et le Deep Learning, le Neural Machine Translation traite une phrase ou un document source dans son ensemble pour en comprendre le sens. Après examen de la grammaire et des mots employés, les moteurs neuronaux analysent le contexte et le vocabulaire afin d’offrir une traduction de qualité, la plus précise et la plus pertinente possible.

La traduction en ligne fait peau neuve

Avec des capacités variées et une meilleure productivité, le Neural Machine Translation vise ainsi à offrir des services de traduction avancés, notamment pour la gestion de projet des entreprises. Après avoir effectué des tests de traduction chinois anglais pour palier aux erreurs habituelles de son outil de traduction, Google a lancé Google Neural Machine Translation (GNMT) son réseau neuronal disponible en 8 langues. Microsoft a rivalisé avec l’application mobile Microsoft Translator permettant de traduire des documents dans une soixantaine de langues différentes et l’outil Skype Translator pour faciliter les conversations de groupes allant jusqu’à 100 interlocuteurs.

Les limites du Neural Machine Translation

Avec une masse de données réelles stockées considérables, les outils modulaires de traduction en ligne évoluent à une vitesse importante. Mais dans cet amas d’informations conservé par Google et Microsoft, le Neural Machine Translation pose le problème de la protection des données. Une faille du cloud API que les systèmes neuronaux AdaptativeMT de SDL et Pure Neural MT de SYSTRAN, dont la R&D se trouve en France, tâchent d’améliorer grâce à l’utilisation de connexions cryptées et confidentielles.

En dépit d’un taux d’erreurs de traduction réduit, des traductions effectuées en un temps record et des économies, les réseaux de neurones présentent également des limites. Tout comme ses ancêtres, les outils de traduction statistiques, le Neural Machine Translation rencontre des difficultés face à un langage très technique ou à l’utilisation de mots rares et de noms propres. Malgré un fort potentiel d’exploitation, ces défauts de mise en application mettent en doute la qualité des traductions fournies qui, au final, nécessite tout de même le recours à des traducteurs humains.