Analizar PDF para extraer Texto por nombre en Python SDK

API para analizar documentos PDF y extraer texto por nombre usando API de Python del lado del servidor.

Get Started

NET PHP GO NODEJS

Cómo analizar documentos PDF para extraer Texto por nombre usando Cloud Python SDK

Para analizar documentos PDF y extraer Texto por nombre vía Cloud Python SDK, utilizaremos Aspose.PDF Cloud Python SDK Este Cloud SDK ayuda a los programadores de Python a desarrollar aplicaciones de creador, anotador, editor, convertidor y analizador de PDF basadas en la nube usando el lenguaje de programación Python a través del Aspose.PDF REST API. Simplemente cree una cuenta en Aspose for Cloud y obtenga la información de su aplicación. Una vez que tenga el App SID y la clave, estará listo para usar el Aspose.PDF Cloud Python SDK. Si el paquete de python está alojado en Github, puede instalarlo directamente desde Github:

Instalación desde Github
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Pasos para analizar PDF para extraer Texto por nombre usando Python SDK

Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer Texto por nombre. Los desarrolladores solo necesitan unas pocas líneas de código.

Cree un nuevo objeto de Configuración con su Secreto de Aplicación y Clave
Cree un objeto para conectarse a la API de la nube
Cargue su archivo de documento
Analice documentos PDF para extraer Texto por nombre en almacenamiento en la nube usando la función get_text_box_field
Verifique la respuesta y registre el resultado
Descargue la información del cuadro de texto en un archivo JSON localmente si es necesario

Este código de ejemplo muestra cómo analizar un documento PDF para extraer Texto por nombre
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractTextBox:
    """Class for extracting text box from PDF document using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

   def Extract(self, documentName: str, texxtboxName: str, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
	response = self.pdf_api.get_text_box_field(documentName, textboxName, **opts)
        if response.code != 200:
            logging.error("ParseExtractTextBox(): Unexpected error!")
        else:
	    logging.info(f"ParseExtractTextBox(): TextBox field '{textboxName}' successfully extracted from the document '{documentName}'.")
            localJsonFile = str(Path.joinpath(localFolder, "text_box_objects.json"))
            with open(localJsonFile, "w", encoding="utf-8") as localFile:            
               jsText = json.dumps(response.field.__dict__, ensure_ascii=False, default=str, indent=4)
               localFile.write(jsText)

Trabajar con el análisis de Texto en PDF a través de Python SDK

Al analizar documentos PDF para la extracción de texto por nombre, puede modificar el contenido del campo TextBox según sea necesario. Esto mantiene la posición del texto en los documentos mientras ahorra tiempo y reduce el trabajo manual. Analizar documentos PDF para extraer texto por nombre con Aspose.PDF Cloud Python SDK.

Con nuestro SDK de Python puede

Agregar encabezado y pie de página del documento PDF en formato de texto o imagen.
Agregar tablas y sellos de texto o imagen a documentos PDF.
Añadir múltiples documentos PDF a un archivo existente.
Trabajar con adjuntos, anotaciones y campos de formularios de PDF.
Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
Eliminar un sello o tabla específica del documento PDF por su ID.
Reemplazar una o varias instancias de texto en una página PDF o de todo el documento.
Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
Extraer varios elementos de archivos PDF y optimizar documentos PDF.
Puede probar nuestra App gratuita para probar la funcionalidad.

¿Por qué Aspose.PDF Cloud para Python?
Lista de Clientes
Seguridad

Analizar PDF para extraer Texto por nombre en Python SDK

API para analizar documentos PDF y extraer texto por nombre usando API de Python del lado del servidor.

Aspose.PDF Cloud SDK para Python

Overview

Cómo analizar documentos PDF para extraer Texto por nombre usando Cloud Python SDK

Instalación desde Github

Pasos para analizar PDF para extraer Texto por nombre usando Python SDK

Este código de ejemplo muestra cómo analizar un documento PDF para extraer Texto por nombre

Trabajar con el análisis de Texto en PDF a través de Python SDK