Analyser les PDF pour extraire des images dans le SDK Python

API pour analyser des documents PDF afin d’extraire des images en utilisant l’API Python côté serveur.

Get Started

NET PHP GO NODEJS

Comment analyser des documents PDF pour extraire des images en utilisant Cloud Python SDK

Pour analyser des documents PDF afin d’extraire des images via Cloud Python SDK, nous utiliserons Aspose.PDF Cloud Python SDK Ce SDK Cloud aide les programmeurs Python à développer des applications de création, d’annotation, d’édition, de conversion et d’analyse de PDF basées sur le cloud en utilisant le langage de programmation Python via Aspose.PDF REST API. Créez simplement un compte sur Aspose for Cloud et obtenez vos informations d’application. Une fois que vous avez l’App SID & clé, vous êtes prêt à utiliser l’Aspose.PDF Cloud Python SDK. Si le package python est hébergé sur Github, vous pouvez l’installer directement depuis Github :

Installation depuis Github
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Étapes pour analyser les PDF afin d'extraire des images en utilisant Python SDK

Les développeurs de Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour extraire des images. Les développeurs ont besoin de seulement quelques lignes de code.

Créez un nouvel objet Configuration avec votre Secret et Clé d’application
Créez un objet pour se connecter à l’API Cloud
Téléchargez votre fichier document
Analysez les documents PDF pour extraire des images dans le stockage cloud en utilisant les fonctions get_images et get_image_extract_as_png
Vérifiez la réponse et enregistrez le résultat
Téléchargez les images au format PNG localement si nécessaire

Cet exemple de code montre comment analyser un document PDF pour extraire des images
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractImages:
    """Class for extracting images from PDF document page using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def extract(self, documentName: str, pageNumber: int, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
        respImages = self.pdf_api.get_images(documentName, pageNumber, **opts)
        if respImages.code != 200:
            logging.error("ParseExtractImages(): Unexpected error!")
        else:
            for img in respImages.images.list:
                response = self.pdf_api.get_image_extract_as_png(documentName, img.id, **opts)

                logging.info(f"ParseExtractImages(): Image '{img.id}' successfully extracted from the document '{documentName}'.")
                local_path = localFolder / ( img.id + '.png' )
                shutil.move(response, str(local_path))

Travailler avec l'analyse d'images dans le PDF via le SDK Python

En analysant des documents PDF pour extraire des images, on peut vérifier systématiquement la validité et la pertinence de chaque image, en s’assurant que toutes les références sont actuelles et fonctionnelles. Pour des tâches telles que le téléchargement d’images liées ou la réalisation d’analyses par lots, l’extraction d’images permet l’automatisation, économisant du temps et réduisant l’effort manuel. Analysez des documents PDF pour extraire des images avec Aspose.PDF Cloud Python SDK.

Avec notre SDK Python vous pouvez

Ajouter l’en-tête et le pied de page d’un document PDF en format texte ou image.
Ajouter des tableaux et des tampons texte ou image aux documents PDF.
Ajouter plusieurs documents PDF à un fichier existant.
Travailler avec les pièces jointes, annotations et champs de formulaire PDF.
Appliquer le cryptage ou le décryptage aux documents PDF et définir un mot de passe.
Supprimer tous les tampons et tableaux d’une page ou de l’ensemble d’un document PDF.
Supprimer un tampon ou un tableau spécifique du document PDF par son ID.
Remplacer une ou plusieurs instances de texte sur une page PDF ou dans l’ensemble du document.
Support étendu pour la conversion de documents PDF en divers autres formats de fichiers.
Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
Vous pouvez essayer notre application gratuite pour tester la fonctionnalité.

Ressources d'apprentissage
Documentation
Code Source
Références API

Pourquoi Aspose.PDF Cloud pour Python ?
Liste des Clients
Sécurité

Analyser les PDF pour extraire des images dans le SDK Python

API pour analyser des documents PDF afin d’extraire des images en utilisant l’API Python côté serveur.

Aspose.PDF Cloud SDK pour Python

Overview

Comment analyser des documents PDF pour extraire des images en utilisant Cloud Python SDK

Installation depuis Github

Étapes pour analyser les PDF afin d'extraire des images en utilisant Python SDK

Cet exemple de code montre comment analyser un document PDF pour extraire des images

Travailler avec l'analyse d'images dans le PDF via le SDK Python