Glossaire

Traduction automatique

Découvre comment la traduction automatique utilise l'IA et l'apprentissage profond pour briser les barrières linguistiques, permettant ainsi une communication et une accessibilité mondiales transparentes.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La traduction automatique (TA) est un sous-domaine de l'intelligence artificielle (IA) et du traitement du langage naturel (NLP) axé sur la traduction automatique de textes ou de discours d'une langue naturelle à une autre. Elle s'appuie sur la linguistique computationnelle et les algorithmes d'apprentissage machine (ML) pour combler les lacunes de communication entre différentes langues sans intervention humaine. L'objectif n'est pas seulement la substitution mot à mot, mais la transmission du sens et de l'intention du texte source avec précision et fluidité dans la langue cible. Cette technologie est devenue de plus en plus sophistiquée, passant des premiers systèmes basés sur des règles à des modèles complexes d'apprentissage profond (DL).

Comment fonctionne la traduction automatique

Les premiers systèmes de traduction automatique s'appuyaient sur de vastes ensembles de règles grammaticales et de dictionnaires bilingues. Plus tard, la traduction automatique statistique (TAS) est apparue, apprenant des modèles de traduction à partir de vastes corpus parallèles (textes associés à leurs traductions). Cependant, la traduction automatique neuronale (NMT) est actuellement à la pointe de la technologie. La traduction automatique neuronale utilise des réseaux neuronaux artificiels (NN) pour apprendre la correspondance entre les langues.

Les modèles NMT, en particulier ceux basés sur des modèles séquence-séquence, utilisent souvent des architectures telles que les réseaux neuronaux récurrents (RNN), en particulier les LSTM ou les GRU, ou plus communément maintenant, l'architecture Transformer. Les Transformers utilisent des mécanismes d'auto-attention(article Attention Is All You Need) pour évaluer l'importance des différents mots de la séquence d'entrée lors de la génération de chaque mot de la séquence de sortie, ce qui permet de capturer plus efficacement les dépendances à long terme. L'apprentissage de ces modèles nécessite de grandes quantités de données textuelles parallèles et d'importantes ressources informatiques, utilisant souvent des GPU ou des TPU pour un apprentissage distribué efficace. Des cadres clés tels que PyTorch et TensorFlow sont largement utilisés pour développer des systèmes de NMT.

Concepts et technologies clés

Plusieurs concepts sont au cœur de la TA moderne :

  • Tokénisation : Décomposition du texte d'entrée en unités plus petites (mots, sous-mots ou caractères) appelées tokens pour que le modèle puisse les traiter.(En savoir plus sur la tokenisation).
  • Embeddings : Représentation des tokens sous forme de vecteurs numériques denses qui capturent le sens sémantique, permettant au modèle de comprendre les relations entre les mots.(Explorer les emboîtements).
  • Mécanisme d'attention : Permet au modèle de se concentrer sur les parties pertinentes de la séquence d'entrée lorsqu'il génère la sortie, ce qui est crucial pour traiter les phrases longues et améliorer la qualité de la traduction.(Comprendre les mécanismes d'attention).
  • Score BLEU : Une mesure commune pour évaluer la qualité de la TA en comparant la traduction générée par la machine à une ou plusieurs traductions humaines de référence(Papineni et al., 2002).
  • Recherche par faisceau : Un algorithme utilisé pendant l'inférence pour générer plusieurs candidats potentiels à la traduction et sélectionner le plus probable, améliorant ainsi la fluidité par rapport à la simple sélection du mot suivant le plus probable à chaque étape.

Distinction par rapport aux termes apparentés

Bien qu'elle soit liée à d'autres tâches de la PNL, la TA a un objectif spécifique :

  • Traitement du langage naturel (NLP) : Le domaine plus large qui englobe la TA, le résumé de texte, l'analyse des sentiments, la réponse aux questions, et bien d'autres choses encore. La TA est une application du TAL.
  • Compréhension du langage naturel (NLU) : Se concentre sur la compréhension par la machine du sens du texte, y compris la reconnaissance de l'intention et l'extraction d'entités. Bien que les capacités de l'ULN améliorent la TA, l'ULN elle-même concerne la compréhension, et pas nécessairement la traduction.(Voir l'entrée de glossaire NLU).
  • Reconnaissance de la parole : Convertit l'audio parlé en texte. Ce texte peut ensuite être utilisé comme entrée pour un système de traduction automatique.(Voir l'entrée de glossaire Reconnaissance de la parole).
  • Synthèse vocale (TTS) : Convertit un texte (potentiellement issu d'un système de TA) en parole synthétisée.(Voir l'entrée de glossaire Text-to-Speech).
  • Modélisation du langage : La tâche de prédire le mot suivant dans une séquence, fondamentale pour de nombreuses tâches NLP, y compris la NMT, mais pas la traduction elle-même.(Explorer la modélisation du langage).

Applications dans le monde réel

La traduction automatique alimente de nombreuses applications :

  • Communication instantanée : Des services comme Google Translate et DeepL Translator permettent aux utilisateurs de traduire des pages Web, des documents et des messages en temps réel, ce qui fait tomber les barrières linguistiques à l'échelle mondiale.
  • Localisation de contenu : Les entreprises utilisent la TA pour traduire les descriptions de produits, les manuels d'utilisation, les campagnes de marketing et les sites Web afin d'atteindre les marchés internationaux plus efficacement que la traduction manuelle seule, en utilisant souvent la TA comme premier passage suivi d'une révision humaine(TA de post-édition).
  • Support client multilingue : L'intégration de la TA dans les plateformes de chatbot et de service client permet aux entreprises de proposer une assistance en plusieurs langues.
  • Accès à l'information : La traduction de documents de recherche, d'articles de presse(Reuters utilise la traduction automatique) et de livres rend l'information accessible au-delà des barrières linguistiques.
  • Apps de traduction en temps réel : Les outils intégrés aux applis de communication ou aux appareils dédiés offrent une traduction en temps quasi réel pour les voyageurs et les collaborations internationales(Skype Translator).

Malgré des progrès significatifs, il reste des défis à relever, tels que la gestion des nuances, des idiomes, du contexte culturel, des langues à faibles ressources, et l'atténuation des biais algorithmiques appris à partir des données. Les travaux futurs se concentrent sur l'amélioration de la conscience du contexte, la gestion de l'ambiguïté, l'obtention d'une plus grande fluidité et l'intégration de la TA avec d'autres modalités comme la vision par ordinateur dans des modèles multimodaux. Des plateformes comme Ultralytics HUB facilitent la formation et le déploiement de modèles d'IA sophistiqués, incluant potentiellement des solutions de TA personnalisées à l'avenir.

Tout lire
OSZAR »