Analyser les PDF pour extraire le texte par nom dans Python SDK

API pour analyser les documents PDF afin d’extraire le texte par nom en utilisant l’API Python côté serveur.

Get Started

NET PHP GO NODEJS

Comment analyser les documents PDF pour extraire le texte par nom en utilisant Cloud Python SDK

Pour analyser les documents PDF afin d’extraire le texte par nom via Cloud Python SDK, nous utiliserons Aspose.PDF Cloud Python SDK Ce Cloud SDK aide les programmeurs Python à développer des applications créatrices, annotatrices, éditrices, convertisseuses et analytiques de PDF basées sur le cloud en utilisant le langage de programmation Python via Aspose.PDF REST API. Créez simplement un compte sur Aspose for Cloud et obtenez les informations de votre application. Une fois que vous avez le SID et la clé de l’application, vous êtes prêt à utiliser Aspose.PDF Cloud Python SDK. Si le package python est hébergé sur Github, vous pouvez l’installer directement depuis Github :

Installation depuis Github
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Étapes pour analyser PDF pour extraire le texte par nom en utilisant Python SDK

Les développeurs Aspose.PDF Cloud peuvent facilement analyser les documents PDF pour extraire le texte par nom. Les développeurs n’ont besoin que de quelques lignes de code.

Créez un nouvel objet Configuration avec votre clé secrète et clé d’application
Créez un objet pour se connecter à l’API Cloud
Téléchargez votre fichier document
Analysez les documents PDF pour extraire le texte par nom dans le stockage cloud en utilisant la fonction get_text_box_field
Vérifiez la réponse et enregistrez le résultat
Téléchargez les informations de la boîte de texte dans un fichier JSON localement si nécessaire

Ce code exemple montre l'analyse d'un document PDF pour extraire le texte par nom
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractTextBox:
    """Class for extracting text box from PDF document using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

   def Extract(self, documentName: str, texxtboxName: str, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
	response = self.pdf_api.get_text_box_field(documentName, textboxName, **opts)
        if response.code != 200:
            logging.error("ParseExtractTextBox(): Unexpected error!")
        else:
	    logging.info(f"ParseExtractTextBox(): TextBox field '{textboxName}' successfully extracted from the document '{documentName}'.")
            localJsonFile = str(Path.joinpath(localFolder, "text_box_objects.json"))
            with open(localJsonFile, "w", encoding="utf-8") as localFile:            
               jsText = json.dumps(response.field.__dict__, ensure_ascii=False, default=str, indent=4)
               localFile.write(jsText)

Travailler avec l'analyse de texte dans PDF via Python SDK

En analysant les documents PDF pour l’extraction de texte par nom, vous pouvez modifier le contenu du champ TextBox selon les besoins. Cela maintient la position du texte dans les documents tout en gagnant du temps et en réduisant le travail manuel. Analysez les documents PDF pour extraire le texte par nom avec Aspose.PDF Cloud Python SDK.

Avec notre SDK Python vous pouvez

Ajouter l’en-tête et le pied de page du document PDF au format texte ou image.
Ajouter des tableaux et des tampons texte ou image aux documents PDF.
Ajouter plusieurs documents PDF à un fichier existant.
Travailler avec les pièces jointes, annotations et champs de formulaire des PDF.
Appliquer un chiffrement ou déchiffrement aux documents PDF et définir un mot de passe.
Supprimer tous les tampons et tableaux d’une page ou de l’ensemble du document PDF.
Supprimer un tampon ou un tableau spécifique du document PDF par son ID.
Remplacer une ou plusieurs instances de texte sur une page PDF ou de l’ensemble du document.
Support étendu pour la conversion de documents PDF en divers autres formats de fichiers.
Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
Vous pouvez essayer notre application gratuite pour tester la fonctionnalité.

Ressources d'apprentissage
Documentation
Code source
Références API

Pourquoi Aspose.PDF Cloud pour Python ?
Liste des clients
Sécurité

Analyser les PDF pour extraire le texte par nom dans Python SDK

API pour analyser les documents PDF afin d’extraire le texte par nom en utilisant l’API Python côté serveur.

Aspose.PDF Cloud SDK pour Python

Overview

Comment analyser les documents PDF pour extraire le texte par nom en utilisant Cloud Python SDK

Installation depuis Github

Étapes pour analyser PDF pour extraire le texte par nom en utilisant Python SDK

Ce code exemple montre l'analyse d'un document PDF pour extraire le texte par nom

Travailler avec l'analyse de texte dans PDF via Python SDK