Analizar PDF para extracción de Tabla por Id en Python SDK
API para analizar documentos PDF para extraer tabla por Id utilizando la API de Python del lado del servidor.
Get StartedCómo analizar documentos PDF para extracción de Tabla por Id utilizando Cloud Python SDK
Para analizar documentos PDF para extraer Tabla por Id a través de Cloud Python SDK, utilizaremos Aspose.PDF Cloud Python SDK Este Cloud SDK ayuda a los programadores de Python a desarrollar aplicaciones basadas en la nube para crear, anotar, editar, convertir y analizar PDF utilizando el lenguaje de programación Python a través de Aspose.PDF REST API. Simplemente crea una cuenta en Aspose for Cloud y obtén la información de tu aplicación. Una vez que tengas el App SID y la clave, estarás listo para usar el Aspose.PDF Cloud Python SDK. Si el paquete de Python está alojado en Github, puedes instalarlo directamente desde Github:
Instalación desde Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Pasos para analizar PDF para extracción de Tabla por Id utilizando Python SDK
Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extracción de Tabla por Id. Los desarrolladores solo necesitan unas pocas líneas de código.
- Crea un nuevo objeto de Configuración con tu Secreto de Aplicación y Clave
- Crea un objeto para conectarse a la API de la Nube
- Sube tu archivo de documento
- Analiza documentos PDF para extracción de Tabla por Id en almacenamiento en la nube utilizando la función get_table
- Verifica la respuesta y registra el resultado
- Descarga la información de la Tabla en un archivo JSON localmente si es necesario
Este código de muestra muestra cómo analizar un documento PDF para extracción de Tabla por Id
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class ParseExtractTable:
"""Class for extracting table from PDF document page using Aspose PDF Cloud API."""
def __init__(self):
self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)
def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = localFolder / documentName
try:
if remoteFolder == None:
self.pdf_api.upload_file(documentName, str(file_path))
else:
opts = { "folder": remoteFolder }
self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
logging.info(f"File {documentName} uploaded successfully.")
except Exception as e:
logging.error(f"Failed to upload file: {e}")
def extract(self, documentName: str, tableId: str, remoteFolder: Path):
self.upload_document(documentName, remoteFolder)
opts = {
"folder": remoteFolder
}
response = self.pdf_api.get_table(documentName, tableId, **opts)
if response.code != 200:
logging.error("ParseExtractTextBox(): Unexpected error!")
else:
logging.info(f"ParseExtractTable(): Table '{tableId}' successfully extracted from the document '{documentName}'.")
localJsonFile = str(Path.joinpath(localFolder, "tables_objects.json"))
with open(localJsonFile, "w", encoding="utf-8") as localFile:
jsText = json.dumps(response.table.__dict__, ensure_ascii=False, default=str, indent=4)
localFile.write(jsText)
Trabajar con el análisis de Tabla por Id en PDF a través de Python SDK
Al analizar documentos PDF para extracción de tabla por Id, puedes modificar el contenido de la Tabla por Id según sea necesario. Esto mantiene la posición de la tabla en los documentos mientras ahorra tiempo y reduce el trabajo manual. Analiza documentos PDF para extracción de tabla por Id con Aspose.PDF Cloud Python SDK.
Con nuestro SDK para Python puedes
- Agregar encabezado y pie de página al documento PDF en formato de texto o imagen.
- Agregar tablas y sellos de texto o imagen a documentos PDF.
- Adjuntar múltiples documentos PDF a un archivo existente.
- Trabajar con adjuntos, anotaciones y campos de formulario de PDF.
- Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
- Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
- Eliminar un sello o tabla específico del documento PDF por su ID.
- Reemplazar instancias individuales o múltiples de texto en una página PDF o en todo el documento.
- Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
- Extraer varios elementos de archivos PDF y optimizar documentos PDF.
- Puedes probar nuestra App gratuita para probar la funcionalidad.
- Recursos de Aprendizaje
- Documentación
- Código Fuente
- Referencias de API
- Soporte del Producto
- Soporte Gratuito
- Soporte Pago
- Blog
- ¿Por qué Aspose.PDF Cloud para Python?
- Lista de Clientes
- Seguridad