Analizar PDF para extracción de Tabla por Id en Python SDK

API para analizar documentos PDF para extraer tabla por Id utilizando la API de Python del lado del servidor.

Get Started

NET PHP GO NODEJS

Cómo analizar documentos PDF para extracción de Tabla por Id utilizando Cloud Python SDK

Para analizar documentos PDF para extraer Tabla por Id a través de Cloud Python SDK, utilizaremos Aspose.PDF Cloud Python SDK Este Cloud SDK ayuda a los programadores de Python a desarrollar aplicaciones basadas en la nube para crear, anotar, editar, convertir y analizar PDF utilizando el lenguaje de programación Python a través de Aspose.PDF REST API. Simplemente crea una cuenta en Aspose for Cloud y obtén la información de tu aplicación. Una vez que tengas el App SID y la clave, estarás listo para usar el Aspose.PDF Cloud Python SDK. Si el paquete de Python está alojado en Github, puedes instalarlo directamente desde Github:

Instalación desde Github
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Pasos para analizar PDF para extracción de Tabla por Id utilizando Python SDK

Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extracción de Tabla por Id. Los desarrolladores solo necesitan unas pocas líneas de código.

Crea un nuevo objeto de Configuración con tu Secreto de Aplicación y Clave
Crea un objeto para conectarse a la API de la Nube
Sube tu archivo de documento
Analiza documentos PDF para extracción de Tabla por Id en almacenamiento en la nube utilizando la función get_table
Verifica la respuesta y registra el resultado
Descarga la información de la Tabla en un archivo JSON localmente si es necesario

Este código de muestra muestra cómo analizar un documento PDF para extracción de Tabla por Id
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractTable:
    """Class for extracting table from PDF document page using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

   def extract(self, documentName: str, tableId: str, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
        
        response  = self.pdf_api.get_table(documentName, tableId, **opts)
        if response.code != 200:
            logging.error("ParseExtractTextBox(): Unexpected error!")
        else:
            logging.info(f"ParseExtractTable(): Table '{tableId}' successfully extracted from the document '{documentName}'.")
            localJsonFile = str(Path.joinpath(localFolder, "tables_objects.json"))
            with open(localJsonFile, "w", encoding="utf-8") as localFile:            
               jsText = json.dumps(response.table.__dict__, ensure_ascii=False, default=str, indent=4)
               localFile.write(jsText)

Trabajar con el análisis de Tabla por Id en PDF a través de Python SDK

Al analizar documentos PDF para extracción de tabla por Id, puedes modificar el contenido de la Tabla por Id según sea necesario. Esto mantiene la posición de la tabla en los documentos mientras ahorra tiempo y reduce el trabajo manual. Analiza documentos PDF para extracción de tabla por Id con Aspose.PDF Cloud Python SDK.

Con nuestro SDK para Python puedes

Agregar encabezado y pie de página al documento PDF en formato de texto o imagen.
Agregar tablas y sellos de texto o imagen a documentos PDF.
Adjuntar múltiples documentos PDF a un archivo existente.
Trabajar con adjuntos, anotaciones y campos de formulario de PDF.
Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
Eliminar un sello o tabla específico del documento PDF por su ID.
Reemplazar instancias individuales o múltiples de texto en una página PDF o en todo el documento.
Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
Extraer varios elementos de archivos PDF y optimizar documentos PDF.
Puedes probar nuestra App gratuita para probar la funcionalidad.

Soporte del Producto
Soporte Gratuito
Soporte Pago
Blog

¿Por qué Aspose.PDF Cloud para Python?
Lista de Clientes
Seguridad

Analizar PDF para extracción de Tabla por Id en Python SDK

API para analizar documentos PDF para extraer tabla por Id utilizando la API de Python del lado del servidor.

Aspose.PDF Cloud SDK para Python

Overview

Cómo analizar documentos PDF para extracción de Tabla por Id utilizando Cloud Python SDK

Instalación desde Github

Pasos para analizar PDF para extracción de Tabla por Id utilizando Python SDK

Este código de muestra muestra cómo analizar un documento PDF para extracción de Tabla por Id

Trabajar con el análisis de Tabla por Id en PDF a través de Python SDK