Quels sont les composants clés d'un réseau de neurones convolutifs (CNN) et leurs rôles respectifs dans les tâches de reconnaissance d'images ?

by Académie EITCA / Mardi, 08 Août 2023 / Publié dans Intelligence artificielle, Deep Learning EITC/AI/DLTF avec TensorFlow, Réseaux de neurones convolutifs dans TensorFlow, Réseaux de neurones convolutifs avec TensorFlow, Révision de l'examen

Un réseau de neurones convolutifs (CNN) est un type de modèle d’apprentissage profond largement utilisé dans les tâches de reconnaissance d’images. Il est spécialement conçu pour traiter et analyser efficacement les données visuelles, ce qui en fait un outil puissant dans les applications de vision par ordinateur. Dans cette réponse, nous discuterons des composants clés d'un CNN et de leurs rôles respectifs dans les tâches de reconnaissance d'images.

1. Couches convolutives : Les couches convolutives sont les éléments constitutifs d'un CNN. Ils consistent en un ensemble de filtres ou de noyaux apprenables qui sont convolués avec l'image d'entrée pour produire des cartes de caractéristiques. Chaque filtre détecte un motif ou une caractéristique spécifique dans l'image, comme les bords, les coins ou les textures. L'opération de convolution consiste à faire glisser le filtre sur l'image et à calculer le produit scalaire entre les poids du filtre et le patch d'image correspondant. Ce processus est répété pour chaque emplacement de l'image, générant une carte de caractéristiques mettant en évidence la présence de différentes caractéristiques.

Exemple : Considérons un filtre 3×3 qui détecte les bords horizontaux. Lorsqu'il est convolué avec une image d'entrée, il produira une carte de caractéristiques qui met l'accent sur les bords horizontaux de l'image.

2. Couches de regroupement : les couches de regroupement sont utilisées pour sous-échantillonner les cartes de caractéristiques générées par les couches convolutives. Ils réduisent les dimensions spatiales des cartes de caractéristiques tout en conservant les informations les plus importantes. L'opération de pooling la plus couramment utilisée est le pooling maximum, qui sélectionne la valeur maximale dans une fenêtre de pooling. Cela contribue à réduire la complexité de calcul du réseau et le rend plus robuste aux petites variations spatiales de l'image d'entrée.

Exemple : l'application du regroupement maximal avec une fenêtre de regroupement 2 × 2 sur une carte de caractéristiques sélectionnera la valeur maximale dans chaque région 2 × 2 qui ne se chevauchent pas, réduisant ainsi les dimensions spatiales de moitié.

3. Fonctions d'activation : les fonctions d'activation introduisent une non-linéarité dans le CNN, lui permettant d'apprendre des modèles complexes et de faire des prédictions. La fonction d'activation la plus couramment utilisée dans les CNN est l'unité linéaire rectifiée (ReLU), qui calcule la sortie comme le maximum de zéro et l'entrée. ReLU est préféré en raison de sa simplicité et de sa capacité à atténuer le problème du gradient de disparition.

Exemple : si la sortie d'un neurone est négative, ReLU la met à zéro, éteignant ainsi le neurone. Si la sortie est positive, ReLU la maintient inchangée.

4. Couches entièrement connectées : les couches entièrement connectées sont chargées de faire les prédictions finales basées sur les caractéristiques extraites. Ils prennent les cartes de caractéristiques aplaties des couches précédentes et les transmettent à travers une série de neurones entièrement connectés. Chaque neurone de la couche entièrement connectée est connecté à chaque neurone de la couche précédente, ce qui lui permet d'apprendre des relations complexes entre les caractéristiques et de faire des prédictions précises.

Exemple : dans une tâche de reconnaissance d'image, la couche entièrement connectée peut avoir des neurones correspondant à différentes classes, telles que « chat », « chien » et « voiture ». La sortie de la couche entièrement connectée peut être interprétée comme les probabilités de l’image d’entrée appartenant à chaque classe.

5. Fonction de perte : la fonction de perte mesure l'écart entre les sorties prédites et les étiquettes de vérité terrain. Il quantifie les performances du CNN sur la tâche à accomplir et fournit un signal pour mettre à jour les paramètres du modèle pendant la formation. Le choix de la fonction de perte dépend de la tâche de reconnaissance d'image spécifique, telle que l'entropie croisée binaire pour la classification binaire ou l'entropie croisée catégorielle pour la classification multi-classes.

Exemple : dans une tâche de classification binaire, la perte d'entropie croisée binaire compare la probabilité prédite de la classe positive avec la véritable étiquette (0 ou 1) et pénalise les écarts importants entre elles.

Un réseau neuronal convolutif (CNN) se compose de couches convolutives, de couches de regroupement, de fonctions d'activation, de couches entièrement connectées et d'une fonction de perte. Les couches convolutives extraient les caractéristiques significatives de l'image d'entrée, tandis que les couches de regroupement sous-échantillonnent les cartes de caractéristiques. Les fonctions d'activation introduisent la non-linéarité et les couches entièrement connectées effectuent les prédictions finales. La fonction de perte mesure l'écart entre les résultats prédits et les étiquettes de vérité terrain, guidant ainsi le processus de formation.

D'autres questions et réponses récentes concernant Réseaux de neurones convolutifs dans TensorFlow:

Plus de questions et réponses :

Tagged under: Intelligence artificielle, CNN, Vision par ordinateur, Réseau neuronal convolutif, L'apprentissage en profondeur, Reconnaissance d'image

Académie EITCA

Quels sont les composants clés d'un réseau de neurones convolutifs (CNN) et leurs rôles respectifs dans les tâches de reconnaissance d'images ?

D'autres questions et réponses récentes concernant Réseaux de neurones convolutifs dans TensorFlow:

Plus de questions et réponses :

EITCA Academy fait partie du cadre européen de certification informatique

Eligibilité à l'EITCA Academy 80% Soutien à la subvention EITCI DSJC

Académie EITCA

CONNECTEZ-VOUS À VOTRE COMPTE PAR VOTRE NOM D'UTILISATEUR OU VOTRE ADRESSE EMAIL

OUBLIÉ VOS DÉTAILS?

CRÉER UN COMPTE

Quels sont les composants clés d'un réseau de neurones convolutifs (CNN) et leurs rôles respectifs dans les tâches de reconnaissance d'images ?

D'autres questions et réponses récentes concernant Réseaux de neurones convolutifs dans TensorFlow:

Plus de questions et réponses :

Eligibilité à l'EITCA Academy 80% Soutien à la subvention EITCI DSJC