PNG JPG BMP TIFF PDF
Aspose.PDF  for Python

Extraire des pages de PDF via l’API Python Cloud

Extraire des pages de documents PDF à l’aide de l’API Python Cloud.

Get Started

Comment extraire des pages de PDF via l'API Python Cloud

Pour extraire des pages de PDF, nous utiliserons Aspose.PDF Cloud Python SDK. Cet SDK Cloud aide les programmeurs Python à développer des applications basées sur le cloud pour créer, annoter, éditer et convertir des PDF en utilisant la langue de programmation Python via l’API REST d’Aspose.PDF. Créez simplement un compte sur Aspose for Cloud et obtenez vos informations d’application. Une fois que vous avez le App SID & key, vous êtes prêt à donner l’API Python Cloud d’Aspose.PDF. Si le package Python est hébergé sur Github, vous pouvez l’installer directement depuis Github :

Installation depuis Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Commande de la Console du Gestionnaire de Paquets

     
    pip install asposepdfcloud

Étapes pour obtenir des pages de PDF via l'API Python

Les développeurs Aspose.PDF Cloud peuvent facilement charger et extraire des pages de PDF en quelques lignes de code.

  1. Installez Python SDK
  2. Téléchargez un document PDF sur le serveur Aspose Cloud.
  3. Téléchargez le document PDF traité sur le serveur Aspose Cloud.
  4. Obtenez les informations sur les pages du document PDF.
 

Extraire des pages de PDF utilisant Python


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, DocumentPagesResponse

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.png"
        PAGE_NUMBER = 2

    class PdfPages:
        """ Class for managing PDF pages using Aspose PDF Cloud API. """
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """ Initialize the API client. """
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """ Upload a PDF document to the Aspose Cloud server. """
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def get_page_info(self):
            """ Get page information of the PDF document. """
            if self.pdf_api:
                result_pages: DocumentPagesResponse = self.pdf_api.get_page(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)

                if result_pages.code == 200:
                    logging.info(f"Page #{Config.PAGE_NUMBER} information: {result_pages.page}")
                else:
                    logging.error(f"Failed to get the page #{Config.PAGE_NUMBER}.")

        def get_page_as_png(self):
            """ Get page information of the PDF document. """
            if self.pdf_api:
                try:
                    result_pages = self.pdf_api.get_page_convert_to_png(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
                    local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
                    shutil.move(result_pages, str(local_path))
                    logging.info(f"download_result(): File successfully downloaded: {local_path}")
                except Exception as e:
                    logging.error(f"download_result(): Failed to download file: {e}")

    if __name__ == "__main__":
        pdf_pages = PdfPages()
        pdf_pages.upload_document()
        pdf_pages.get_page_info()
        pdf_pages.get_page_as_png()
 

Travaillez avec des pages dans PDF

L’extraction de pages d’un PDF est une tâche courante qui sert à divers usages dans différents contextes. Ce processus consiste à sélectionner des pages spécifiques d’un document plus volumineux pour créer un nouveau fichier PDF séparé. Comprendre les raisons derrière cette pratique peut aider à gérer et utiliser efficacement les documents PDF.​ Les fichiers PDF volumineux peuvent être encombrants à partager ou à stocker. En n’extrayant que les pages nécessaires, les utilisateurs peuvent créer des fichiers plus petits, plus gérables. Cela est particulièrement utile lorsque seule une partie du document est pertinente pour un usage spécifique. Par exemple, en supprimant les pages non nécessaires, on peut significativement réduire la taille du fichier, facilitant ainsi la gestion et la distribution. ​ L’extraction de pages permet aux utilisateurs de réutiliser le contenu pour différentes applications. Par exemple, on peut extraire des pages d’un rapport complet pour créer un résumé autonome ou isoler des données spécifiques pour une analyse. Cela permet de réutiliser le contenu existant sans avoir à recréer les informations à partir de rien. Extrayez les pages de documents PDF avec Aspose.PDF Cloud Python SDK.

Avec notre bibliothèque Python, vous pouvez :

  • Combiner des documents PDF.
  • Diviser des fichiers PDF.
  • Convertir des PDF en d’autres formats, et vice versa.
  • Manipuler des annotations.
  • Travailler avec des images dans les PDF, etc.
  • Vous pouvez essayer notre application gratuite pour tester la fonctionnalité en ligne.