Comment le score BLEU peut-il être utilisé pour évaluer les performances d'un modèle de traduction personnalisé entraîné avec AutoML Translation ?

by Académie EITCA / Mercredi, 02 Août 2023 / Publié dans Intelligence artificielle, EITC/AI/GCML Google Cloud Machine Learning, Plateforme Google Cloud AI, Traduction AutoML, Révision de l'examen

Le score BLEU est une mesure largement utilisée pour évaluer les performances des modèles de traduction automatique. Il mesure la similarité entre une traduction générée automatiquement et une ou plusieurs traductions de référence. Dans le contexte d'un modèle de traduction personnalisé entraîné avec AutoML Translation, le score BLEU peut fournir des informations précieuses sur la qualité et l'efficacité du résultat du modèle.

Pour comprendre comment le score BLEU est utilisé, il est important d’abord d’en saisir les concepts sous-jacents. BLEU signifie Bilingual Evaluation Understudy, et il a été développé pour évaluer automatiquement la qualité des traductions automatiques en les comparant aux traductions de référence générées par l'homme. Le score varie de 0 à 1, un score plus élevé indiquant une meilleure traduction.

AutoML Translation est un outil puissant proposé par Google Cloud AI Platform qui permet aux utilisateurs de former des modèles de traduction personnalisés à l'aide de leurs propres données. Une fois le modèle entraîné, il peut être utilisé pour générer des traductions pour le nouveau texte d'entrée. Le score BLEU peut ensuite être utilisé pour évaluer la qualité de ces traductions.

Pour calculer le score BLEU, les traductions générées par le modèle sont comparées à une ou plusieurs traductions de référence. La comparaison est basée sur des n-grammes, qui sont des séquences contiguës de n mots. Le score BLEU prend en compte non seulement la précision des n-grammes dans la traduction générée par le modèle mais aussi leur présence dans les traductions de référence. Cela permet de mesurer à la fois l’adéquation et la fluidité des traductions.

Illustrons cela avec un exemple. Supposons que nous ayons une traduction de référence : « Le chat est assis sur le tapis ». Et le modèle génère la traduction suivante : « Le chat est assis sur le tapis ». Nous pouvons diviser ces phrases en n-grammes :

Référence : ["Le", "chat", "est", "assis", "sur", "le", "tapis"] Modèle : ["Le", "chat", "assis", "sur", "le paillasson"]

Dans ce cas, le modèle traduit correctement la majorité des n-grammes, mais il manque le temps du verbe (« est » contre « est assis »). Le score BLEU refléterait cela en attribuant un score inférieur à la traduction.

Le score BLEU peut être calculé à l'aide de diverses méthodes, telles que la pénalité modifiée de précision et de brièveté. La précision modifiée tient compte du fait qu'une traduction peut contenir plusieurs occurrences d'un n-gramme, tandis que la pénalité de brièveté pénalise les traductions nettement plus courtes que les traductions de référence.

En évaluant le score BLEU d'un modèle de traduction personnalisé formé avec AutoML Translation, les utilisateurs peuvent obtenir des informations sur les performances du modèle et identifier les domaines à améliorer. Ils peuvent comparer les scores BLEU de différents modèles ou itérations pour suivre les progrès et prendre des décisions éclairées concernant la sélection ou le réglage du modèle.

Le score BLEU est une mesure précieuse pour évaluer les performances des modèles de traduction personnalisés formés avec AutoML Translation. Il fournit une mesure quantitative de la qualité des traductions générées automatiquement en les comparant aux traductions de référence. En analysant le score BLEU, les utilisateurs peuvent évaluer l'efficacité de leurs modèles et prendre des décisions basées sur les données pour améliorer la qualité de la traduction.

D'autres questions et réponses récentes concernant Traduction AutoML:

Plus de questions et réponses :

Champ: Intelligence artificielle
Programme: EITC/AI/GCML Google Cloud Machine Learning (accéder au programme de certification)
Leçon: Plateforme Google Cloud AI (aller à la leçon correspondante)
Topic: Traduction AutoML (aller au sujet connexe)
Révision de l'examen

Tagged under: Intelligence artificielle, Traduction AutoML, BLEU Score, Mesure d'évaluation, Plateforme Google Cloud AI, Traduction automatique

Académie EITCA

Comment le score BLEU peut-il être utilisé pour évaluer les performances d'un modèle de traduction personnalisé entraîné avec AutoML Translation ?

D'autres questions et réponses récentes concernant Traduction AutoML:

Plus de questions et réponses :

EITCA Academy fait partie du cadre européen de certification informatique

Eligibilité à l'EITCA Academy 80% Soutien à la subvention EITCI DSJC

Académie EITCA

CONNECTEZ-VOUS À VOTRE COMPTE PAR VOTRE NOM D'UTILISATEUR OU VOTRE ADRESSE EMAIL

OUBLIÉ VOS DÉTAILS?

CRÉER UN COMPTE

Comment le score BLEU peut-il être utilisé pour évaluer les performances d'un modèle de traduction personnalisé entraîné avec AutoML Translation ?

D'autres questions et réponses récentes concernant Traduction AutoML:

Plus de questions et réponses :

Eligibilité à l'EITCA Academy 80% Soutien à la subvention EITCI DSJC