Pour entraîner un modèle à l'aide d'AutoML Vision, vous pouvez suivre un processus étape par étape qui implique la préparation des données, l'entraînement du modèle et l'évaluation. AutoML Vision est un outil puissant fourni par Google Cloud qui simplifie le processus de formation de modèles d'apprentissage automatique personnalisés pour les tâches de reconnaissance d'images. Il exploite des algorithmes d'apprentissage en profondeur et automatise de nombreuses tâches complexes impliquées dans la formation des modèles.
La première étape de la formation d'un modèle à l'aide d'AutoML Vision consiste à rassembler et à préparer vos données de formation. Ces données doivent consister en un ensemble d'images étiquetées qui représentent les différentes classes ou catégories que vous souhaitez que votre modèle reconnaisse. Il est important de garantir que vos données de formation sont diverses et représentatives des scénarios réels que vous attendez de votre modèle. Plus vos données d’entraînement sont variées et complètes, plus votre modèle sera capable de généraliser et de faire des prédictions précises.
Une fois que vos données d'entraînement sont prêtes, vous pouvez passer à l'étape suivante, qui consiste à créer un ensemble de données dans l'interface AutoML Vision. Cela implique de télécharger vos images de formation et de fournir les étiquettes correspondantes pour chaque image. AutoML Vision prend en charge divers formats d'image, notamment JPEG et PNG. De plus, vous pouvez également fournir des cadres de délimitation pour les tâches de détection d'objets, ce qui améliore encore les capacités de votre modèle.
Après avoir créé l'ensemble de données, vous pouvez démarrer le processus de formation du modèle. AutoML Vision utilise une technique appelée apprentissage par transfert, qui vous permet d'exploiter des modèles pré-entraînés qui ont été formés sur des ensembles de données à grande échelle. Cette approche réduit considérablement la quantité de données de formation et de ressources informatiques nécessaires pour obtenir de bonnes performances. AutoML Vision propose une sélection de modèles pré-entraînés, tels qu'EfficientNet et MobileNet, parmi lesquels vous pouvez choisir en fonction de vos besoins spécifiques.
Pendant le processus de formation, AutoML Vision affine le modèle pré-entraîné à l'aide de vos données d'entraînement étiquetées. Il ajuste automatiquement les paramètres du modèle et optimise l'architecture du modèle pour améliorer ses performances sur votre tâche spécifique. Le processus de formation est généralement itératif, avec plusieurs époques ou itérations, pour améliorer progressivement la précision du modèle. AutoML Vision utilise également des techniques d'augmentation des données, telles que des rotations et des retournements aléatoires, pour améliorer encore les capacités de généralisation du modèle.
Une fois la formation terminée, AutoML Vision vous fournit des métriques d'évaluation pour évaluer les performances de votre modèle. Ces mesures incluent la précision, le rappel et le score F1, qui mesurent la capacité du modèle à classer correctement les images. Vous pouvez également visualiser les prédictions du modèle sur un ensemble de données de validation pour mieux comprendre ses forces et ses faiblesses. AutoML Vision vous permet d'itérer sur votre modèle en affinant les données d'entraînement, en ajustant les hyperparamètres et en reformant le modèle pour améliorer ses performances.
Une fois que vous êtes satisfait des performances de votre modèle entraîné, vous pouvez le déployer pour faire des prédictions sur de nouvelles images inédites. AutoML Vision fournit une API REST qui vous permet d'intégrer votre modèle dans vos applications ou services. Vous pouvez envoyer des données d'image à l'API, et elle renverra les étiquettes ou les cadres de délimitation prédits en fonction de l'inférence du modèle entraîné.
La formation d'un modèle à l'aide d'AutoML Vision implique la préparation des données, la création d'un ensemble de données, la formation du modèle, l'évaluation et le déploiement. En suivant ce processus, vous pouvez tirer parti de la puissance d'AutoML Vision pour entraîner des modèles d'apprentissage automatique personnalisés pour les tâches de reconnaissance d'images, sans avoir besoin de connaissances approfondies des algorithmes d'apprentissage profond ou de la configuration de l'infrastructure.
D'autres questions et réponses récentes concernant Progresser dans l'apprentissage automatique:
- Lorsqu'un noyau est forké avec des données et que l'original est privé, le noyau forké peut-il être public et si tel est le cas, ne constitue-t-il pas une violation de la vie privée ?
- Quelles sont les limites du travail avec de grands ensembles de données en apprentissage automatique ?
- L’apprentissage automatique peut-il apporter une assistance dialogique ?
- Qu'est-ce que le terrain de jeu TensorFlow ?
- Le mode impatient empêche-t-il la fonctionnalité de calcul distribué de TensorFlow ?
- Les solutions cloud de Google peuvent-elles être utilisées pour dissocier l'informatique du stockage pour une formation plus efficace du modèle ML avec le Big Data ?
- Le moteur d'apprentissage automatique Google Cloud (CMLE) propose-t-il une acquisition et une configuration automatiques des ressources et gère-t-il l'arrêt des ressources une fois la formation du modèle terminée ?
- Est-il possible d’entraîner des modèles d’apprentissage automatique sur des ensembles de données arbitrairement volumineux sans problème ?
- Lors de l'utilisation de CMLE, la création d'une version nécessite-t-elle de spécifier la source d'un modèle exporté ?
- CMLE peut-il lire les données de stockage Google Cloud et utiliser un modèle entraîné spécifié pour l'inférence ?
Voir plus de questions et réponses dans Faire progresser l'apprentissage automatique