Comment accéder au texte extrait d'une image à l'aide de l'API Google Vision ?

by Académie EITCA / Mercredi, 27 Décembre 2023 / Publié dans Intelligence artificielle, API Google Vision EITC/AI/GVAPI, Comprendre le texte dans les données visuelles, Détection et extraction de texte à partir de l'écriture manuscrite, Révision de l'examen

Pour accéder au texte extrait d'une image à l'aide de l'API Google Vision, vous pouvez suivre une série d'étapes qui impliquent l'utilisation des capacités de reconnaissance optique de caractères (OCR) de l'API. La technologie OCR de l'API Google Vision permet la détection et l'extraction de texte à partir d'images, y compris l'écriture manuscrite. Cette fonctionnalité est particulièrement utile dans les applications qui nécessitent l'analyse et la compréhension des informations textuelles présentes dans les données visuelles.

Tout d'abord, vous devez configurer l'environnement nécessaire pour travailler avec l'API Google Vision. Cela implique de créer un projet dans Google Cloud Console, d'activer l'API Vision et d'obtenir les informations d'authentification requises telles qu'une clé API ou une clé de compte de service.

Une fois votre environnement configuré, vous pouvez utiliser la méthode « asyncBatchAnnotateFiles » de l'API Vision pour effectuer l'OCR sur un fichier image. Cette méthode vous permet de transmettre une liste de fichiers image à traiter et de recevoir les résultats de manière asynchrone. Alternativement, vous pouvez utiliser la méthode « asyncBatchAnnotateImages » pour traiter directement une liste d'images.

Pour extraire le texte d'une image, vous devez créer une instance de l'objet `AnnotateImageRequest` et spécifier les fonctionnalités souhaitées. Dans ce cas, vous définirez la fonctionnalité `TEXT_DETECTION` pour indiquer que vous souhaitez extraire le texte de l'image. Vous pouvez également spécifier des paramètres supplémentaires tels que l'indication de langue pour améliorer la précision de l'OCR.

Ensuite, vous devez encoder le fichier image dans une chaîne codée en base64 et créer une instance de l'objet « Image » en utilisant les données d'image codées. Cet objet `Image` doit être ajouté à l'objet `AnnotateImageRequest` créé précédemment.

Après avoir configuré la requête, vous pouvez l'envoyer à l'API Vision à l'aide de la méthode `batchAnnotateImages` ou `batchAnnotateFiles`, selon l'approche choisie. L'API traitera l'image et renverra une réponse contenant le texte extrait.

Pour accéder au texte extrait de la réponse, vous pouvez parcourir le champ « textAnnotations » de l'objet « AnnotateImageResponse ». Ce champ contient une liste d'objets `EntityAnnotation`, chacun représentant un élément de texte détecté dans l'image. Le champ `description` de chaque objet `EntityAnnotation` contient le texte extrait.

Voici un exemple d'extrait de code en Python qui montre comment accéder au texte extrait d'une image à l'aide de l'API Google Vision :

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

Dans cet exemple, la fonction « extract_text_from_image » prend le chemin d'accès à un fichier image en entrée et utilise la bibliothèque client Google Cloud Vision pour envoyer une requête à l'API Vision. Le texte extrait est ensuite imprimé.

Pour accéder au texte extrait d'une image à l'aide de l'API Google Vision, vous devez configurer l'environnement, créer un objet « AnnotateImageRequest » avec les fonctionnalités souhaitées, encoder le fichier image, envoyer la requête à l'API et récupérer le texte extrait. de la réponse. Les capacités OCR de l'API Vision permettent la détection et l'extraction de texte à partir d'images, y compris l'écriture manuscrite.

D'autres questions et réponses récentes concernant Détection et extraction de texte à partir de l'écriture manuscrite:

Plus de questions et réponses :

Tagged under: Intelligence artificielle, API Google Cloud Vision, Traitement d'image, OCR, Reconnaissance optique de caractères, Extraction de texte

Académie EITCA

Comment accéder au texte extrait d'une image à l'aide de l'API Google Vision ?

D'autres questions et réponses récentes concernant Détection et extraction de texte à partir de l'écriture manuscrite:

Plus de questions et réponses :

EITCA Academy fait partie du cadre européen de certification informatique

Eligibilité à l'EITCA Academy 80% Soutien à la subvention EITCI DSJC

Académie EITCA

CONNECTEZ-VOUS À VOTRE COMPTE PAR VOTRE NOM D'UTILISATEUR OU VOTRE ADRESSE EMAIL

OUBLIÉ VOS DÉTAILS?

CRÉER UN COMPTE

Comment accéder au texte extrait d'une image à l'aide de l'API Google Vision ?

D'autres questions et réponses récentes concernant Détection et extraction de texte à partir de l'écriture manuscrite:

Plus de questions et réponses :

Eligibilité à l'EITCA Academy 80% Soutien à la subvention EITCI DSJC