Analizar PDF para extraer campos de formulario como XML en Python SDK

API para analizar documentos PDF y extraer campos de formulario como XML utilizando API de Python del lado del servidor.

Get Started

NET PHP GO NODEJS

Cómo analizar documentos PDF para extraer campos de formulario como XML usando Cloud Python SDK

Para analizar documentos PDF y extraer campos de formulario como XML a través de Cloud Python SDK, utilizaremos Aspose.PDF Cloud Python SDK Este SDK en la nube ayuda a los programadores de Python a desarrollar aplicaciones de creación, anotación, edición, conversión y análisis de PDF basadas en la nube utilizando el lenguaje de programación Python a través de Aspose.PDF REST API. Simplemente cree una cuenta en Aspose for Cloud y obtenga la información de su aplicación. Una vez que tenga el SID y la clave de la aplicación, estará listo para usar Aspose.PDF Cloud Python SDK. Si el paquete de Python está alojado en Github, puede instalarlo directamente desde Github:

Instalación desde Github
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Comando de la consola del administrador de paquetes     
    pip install asposepdfcloud

Pasos para analizar PDF y extraer campos de formulario como XML usando Python SDK

Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer campos de formulario como XML. Los desarrolladores solo necesitan unas pocas líneas de código.

Cree un nuevo objeto de Configuración con su Clave y Secreto de Aplicación
Cree un objeto para conectarse a la API de la nube
Cargue su archivo de documento
Analice documentos PDF para extraer campos de formulario como XML en almacenamiento en la nube usando la función put_export_fields_from_pdf_to_xml_in_storage
Verifique la respuesta y registre el resultado
Descargue el archivo XML localmente si es necesario

Este código de ejemplo muestra cómo analizar un documento PDF para extraer campos de formulario como XML
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ExportFormToXML:
    """Class for extracting PDF form fields into XML using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str,  output_prefix: str):
        """Download the processed PDF document from the Aspose Cloud server."""
        if self.pdf_api:
            try:
                temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
                local_path = localFolder / ( output_prefix + outputDocument )
                shutil.move(temp_file, str(local_path))
                logging.info(f"download_result(): File successfully downloaded: {local_path}")
            except Exception as e:
                logging.error(f"download_result(): Failed to download file: {e}")


    def Extract(self, documentName: str, outputXMLName: str, localFolder: Path, remoteFolder: str ):
        self.uploadDocument(documentName, remoteFolder)

        XMLPath = str(Path.joinpath(Path(remoteFolder), outputXMLName))
        opts = {
            "folder": remoteFolder
        }
        response = self.pdf_put_export_fields_from_pdf_to_xml_in_storage(documentName, XMLPath, **opts)
        if response.code != 200:
            logging.error("ExportFormToXML(): Unexpected error!")
        else:
            logging.info(f"ExportFormToXML(): Pdf document '{documentName}' form fields successfully exported to '{outputXMLName}' file.")
            self.downloadFile(outputXMLName, outputXMLName, localFolder, remoteFolder, "")

Trabajar con el análisis de formularios en PDF a través de Python SDK

Al analizar documentos PDF para extraer campos de formulario como XML, se puede verificar sistemáticamente la validez y relevancia de cada campo de formulario, asegurando que todas las referencias estén actualizadas y sean funcionales. Para tareas como descargar campos de formulario como XML o realizar análisis por lotes, la extracción de campos de formulario permite la automatización, ahorrando tiempo y reduciendo el esfuerzo manual. Analice documentos PDF para extraer campos de formulario como XML con Aspose.PDF Cloud Python SDK.

Con nuestro SDK de Python puedes

Agregar encabezado y pie de página al documento PDF en formato de texto o imagen.
Agregar tablas y sellos de texto o imagen a documentos PDF.
Adjuntar varios documentos PDF a un archivo existente.
Trabajar con archivos adjuntos, anotaciones y campos de formulario de PDF.
Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
Eliminar todos los sellos y tablas de una página o documento PDF completo.
Eliminar un sello o tabla específico del documento PDF por su ID.
Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
Extraer varios elementos de archivos PDF y optimizar documentos PDF.
Puedes probar nuestra App gratuita para probar la funcionalidad.

Soporte del Producto
Soporte Gratuito
Soporte Pagado
Blog

¿Por qué Aspose.PDF Cloud para Python?
Lista de Clientes
Seguridad

Analizar PDF para extraer campos de formulario como XML en Python SDK

API para analizar documentos PDF y extraer campos de formulario como XML utilizando API de Python del lado del servidor.

Aspose.PDF Cloud SDK para Python

Overview

Cómo analizar documentos PDF para extraer campos de formulario como XML usando Cloud Python SDK

Instalación desde Github

Comando de la consola del administrador de paquetes

Pasos para analizar PDF y extraer campos de formulario como XML usando Python SDK

Este código de ejemplo muestra cómo analizar un documento PDF para extraer campos de formulario como XML

Trabajar con el análisis de formularios en PDF a través de Python SDK