HTML JPG PDF XML DOCX
  Product Family
PDF

Analyser un PDF pour extrait de table par Id dans Python SDK

API pour analyser des documents PDF afin d’extraire la table par Id en utilisant l’API Python côté serveur.

Get Started

Comment analyser des documents PDF pour l'extraction de table par Id en utilisant Cloud Python SDK

Pour analyser des documents PDF afin d’extraire la table par Id via Cloud Python SDK, nous utiliserons Aspose.PDF Cloud Python SDK Ce Cloud SDK aide les programmeurs Python à développer des applications créatrices, annotatrices, éditrices, convertisseuses et analytiques de PDF basées sur le cloud en utilisant le langage de programmation Python via Aspose.PDF REST API. Créez simplement un compte sur Aspose for Cloud et obtenez les informations de votre application. Une fois que vous avez le SID et la clé de l’application, vous êtes prêt à utiliser Aspose.PDF Cloud Python SDK. Si le package python est hébergé sur Github, vous pouvez l’installer directement depuis Github :

Installation depuis Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

     
     

Étapes pour analyser un PDF pour extraction de table par Id en utilisant Python SDK

Les développeurs Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour l’extraction de table par Id. Les développeurs n’ont besoin que de quelques lignes de code.

  1. Créez un nouvel objet Configuration avec votre Secret et Clé d’application
  2. Créez un objet pour se connecter à l’API Cloud
  3. Téléchargez votre fichier de document
  4. Analysez des documents PDF pour l’extraction de table par Id dans le stockage cloud en utilisant la fonction get_table
  5. Vérifiez la réponse et enregistrez le résultat
  6. Téléchargez les informations de la table dans un fichier JSON localement si nécessaire
 

Ce code d'exemple montre l'analyse de document PDF pour extraction de table par Id


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractTable:
    """Class for extracting table from PDF document page using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

   def extract(self, documentName: str, tableId: str, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
        
        response  = self.pdf_api.get_table(documentName, tableId, **opts)
        if response.code != 200:
            logging.error("ParseExtractTextBox(): Unexpected error!")
        else:
            logging.info(f"ParseExtractTable(): Table '{tableId}' successfully extracted from the document '{documentName}'.")
            localJsonFile = str(Path.joinpath(localFolder, "tables_objects.json"))
            with open(localJsonFile, "w", encoding="utf-8") as localFile:            
               jsText = json.dumps(response.table.__dict__, ensure_ascii=False, default=str, indent=4)
               localFile.write(jsText)
 

Travailler avec l'analyse de table par Id dans PDF via Python SDK

En analysant des documents PDF pour l’extraction de table par Id, vous pouvez modifier le contenu de la table par Id selon vos besoins. Cela maintient la position de la table dans les documents tout en économisant du temps et en réduisant le travail manuel. Analysez des documents PDF pour extraire la table par Id avec Aspose.PDF Cloud Python SDK.

Avec notre SDK Python vous pouvez

  • Ajouter l’en-tête et le pied de page du document PDF au format texte ou image.
  • Ajouter des tables et des tampons texte ou image aux documents PDF.
  • Ajouter plusieurs documents PDF à un fichier existant.
  • Travailler avec les pièces jointes, les annotations et les champs de formulaire PDF.
  • Appliquer un cryptage ou un décryptage aux documents PDF et définir un mot de passe.
  • Supprimer tous les tampons et tables d’une page ou d’un document PDF entier.
  • Supprimer un tampon ou une table spécifique du document PDF par son ID.
  • Remplacer une ou plusieurs instances de texte sur une page PDF ou dans l’ensemble du document.
  • Support étendu pour convertir des documents PDF en divers autres formats de fichier.
  • Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
  • Vous pouvez essayer notre application gratuite pour tester la fonctionnalité.

  •