HTML JPG PDF XML DOCX
  Product Family
PDF

Analyser un PDF pour extraire les champs de formulaire en XML dans Python SDK

API pour analyser les documents PDF afin d’extraire les champs de formulaire en XML en utilisant l’API Python côté serveur.

Get Started

Comment analyser les documents PDF pour extraire les champs de formulaire en XML en utilisant Cloud Python SDK

Pour analyser les documents PDF pour extraire les champs de formulaire en XML via Cloud Python SDK, nous utiliserons Aspose.PDF Cloud Python SDK Ce Cloud SDK aide les programmeurs Python à développer des applications de création, annotation, édition, conversion et analyse de PDF basées sur le cloud en utilisant le langage de programmation Python via Aspose.PDF REST API. Créez simplement un compte sur Aspose for Cloud et obtenez les informations de votre application. Une fois que vous avez le SID & la clé de l’application, vous êtes prêt à utiliser Aspose.PDF Cloud Python SDK. Si le package python est hébergé sur Github, vous pouvez l’installer directement depuis Github :

Installation depuis Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Commande de la console du gestionnaire de packages

     
    pip install asposepdfcloud

Étapes pour analyser un PDF pour extraire les champs de formulaire en XML en utilisant Python SDK

Les développeurs Aspose.PDF Cloud peuvent facilement analyser les documents PDF pour extraire les champs de formulaire en XML. Les développeurs n’ont besoin que de quelques lignes de code.

  1. Créez un nouvel objet Configuration avec votre Secret et la clé de l’application
  2. Créez un objet pour se connecter à l’API Cloud
  3. Téléchargez votre fichier document
  4. Analysez les documents PDF pour extraire les champs de formulaire en XML dans le stockage cloud en utilisant la fonction put_export_fields_from_pdf_to_xml_in_storage
  5. Vérifiez la réponse et enregistrez le résultat
  6. Téléchargez le fichier XML localement si nécessaire
 

Cet exemple de code montre l'analyse d'un document PDF pour extraire les champs de formulaire en XML


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ExportFormToXML:
    """Class for extracting PDF form fields into XML using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str,  output_prefix: str):
        """Download the processed PDF document from the Aspose Cloud server."""
        if self.pdf_api:
            try:
                temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
                local_path = localFolder / ( output_prefix + outputDocument )
                shutil.move(temp_file, str(local_path))
                logging.info(f"download_result(): File successfully downloaded: {local_path}")
            except Exception as e:
                logging.error(f"download_result(): Failed to download file: {e}")


    def Extract(self, documentName: str, outputXMLName: str, localFolder: Path, remoteFolder: str ):
        self.uploadDocument(documentName, remoteFolder)

        XMLPath = str(Path.joinpath(Path(remoteFolder), outputXMLName))
        opts = {
            "folder": remoteFolder
        }
        response = self.pdf_put_export_fields_from_pdf_to_xml_in_storage(documentName, XMLPath, **opts)
        if response.code != 200:
            logging.error("ExportFormToXML(): Unexpected error!")
        else:
            logging.info(f"ExportFormToXML(): Pdf document '{documentName}' form fields successfully exported to '{outputXMLName}' file.")
            self.downloadFile(outputXMLName, outputXMLName, localFolder, remoteFolder, "")
 

Travailler avec l'analyse des formulaires dans PDF via Python SDK

En analysant les documents PDF pour extraire les champs de formulaire en XML, on peut systématiquement vérifier la validité et la pertinence de chaque champ de formulaire, en s’assurant que toutes les références sont actuelles et fonctionnelles. Pour des tâches telles que le téléchargement des champs de formulaire en XML ou la réalisation d’analyses par lots, l’extraction des champs de formulaire permet l’automatisation, économisant du temps et réduisant l’effort manuel. Analysez les documents PDF pour extraire les champs de formulaire en XML avec Aspose.PDF Cloud Python SDK.

Avec notre SDK Python, vous pouvez

  • Ajouter l’en-tête et le pied de page d’un document PDF au format texte ou image.
  • Ajouter des tableaux et des tampons de texte ou d’image aux documents PDF.
  • Joindre plusieurs documents PDF à un fichier existant.
  • Travailler avec les pièces jointes, annotations et champs de formulaire PDF.
  • Appliquer le cryptage ou le décryptage aux documents PDF et définir un mot de passe.
  • Supprimer tous les tampons et tableaux d’une page ou d’un document PDF entier.
  • Supprimer un tampon ou un tableau spécifique du document PDF par son ID.
  • Remplacer une ou plusieurs instances de texte sur une page PDF ou dans tout le document.
  • Support étendu pour convertir les documents PDF en divers autres formats de fichiers.
  • Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
  • Vous pouvez essayer notre application gratuite pour tester la fonctionnalité.

  •