Analizar PDF para extraer campos de formulario como XML en Python SDK
API para analizar documentos PDF y extraer campos de formulario como XML utilizando API de Python del lado del servidor.
Get StartedCómo analizar documentos PDF para extraer campos de formulario como XML usando Cloud Python SDK
Para analizar documentos PDF y extraer campos de formulario como XML a través de Cloud Python SDK, utilizaremos Aspose.PDF Cloud Python SDK Este SDK en la nube ayuda a los programadores de Python a desarrollar aplicaciones de creación, anotación, edición, conversión y análisis de PDF basadas en la nube utilizando el lenguaje de programación Python a través de Aspose.PDF REST API. Simplemente cree una cuenta en Aspose for Cloud y obtenga la información de su aplicación. Una vez que tenga el SID y la clave de la aplicación, estará listo para usar Aspose.PDF Cloud Python SDK. Si el paquete de Python está alojado en Github, puede instalarlo directamente desde Github:
Instalación desde Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Comando de la consola del administrador de paquetes
pip install asposepdfcloud
Pasos para analizar PDF y extraer campos de formulario como XML usando Python SDK
Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer campos de formulario como XML. Los desarrolladores solo necesitan unas pocas líneas de código.
- Cree un nuevo objeto de Configuración con su Clave y Secreto de Aplicación
- Cree un objeto para conectarse a la API de la nube
- Cargue su archivo de documento
- Analice documentos PDF para extraer campos de formulario como XML en almacenamiento en la nube usando la función put_export_fields_from_pdf_to_xml_in_storage
- Verifique la respuesta y registre el resultado
- Descargue el archivo XML localmente si es necesario
Este código de ejemplo muestra cómo analizar un documento PDF para extraer campos de formulario como XML
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class ExportFormToXML:
"""Class for extracting PDF form fields into XML using Aspose PDF Cloud API."""
def __init__(self):
self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)
def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = localFolder / documentName
try:
if remoteFolder == None:
self.pdf_api.upload_file(documentName, str(file_path))
else:
opts = { "folder": remoteFolder }
self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
logging.info(f"File {documentName} uploaded successfully.")
except Exception as e:
logging.error(f"Failed to upload file: {e}")
def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str, output_prefix: str):
"""Download the processed PDF document from the Aspose Cloud server."""
if self.pdf_api:
try:
temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
local_path = localFolder / ( output_prefix + outputDocument )
shutil.move(temp_file, str(local_path))
logging.info(f"download_result(): File successfully downloaded: {local_path}")
except Exception as e:
logging.error(f"download_result(): Failed to download file: {e}")
def Extract(self, documentName: str, outputXMLName: str, localFolder: Path, remoteFolder: str ):
self.uploadDocument(documentName, remoteFolder)
XMLPath = str(Path.joinpath(Path(remoteFolder), outputXMLName))
opts = {
"folder": remoteFolder
}
response = self.pdf_put_export_fields_from_pdf_to_xml_in_storage(documentName, XMLPath, **opts)
if response.code != 200:
logging.error("ExportFormToXML(): Unexpected error!")
else:
logging.info(f"ExportFormToXML(): Pdf document '{documentName}' form fields successfully exported to '{outputXMLName}' file.")
self.downloadFile(outputXMLName, outputXMLName, localFolder, remoteFolder, "")
Trabajar con el análisis de formularios en PDF a través de Python SDK
Al analizar documentos PDF para extraer campos de formulario como XML, se puede verificar sistemáticamente la validez y relevancia de cada campo de formulario, asegurando que todas las referencias estén actualizadas y sean funcionales. Para tareas como descargar campos de formulario como XML o realizar análisis por lotes, la extracción de campos de formulario permite la automatización, ahorrando tiempo y reduciendo el esfuerzo manual. Analice documentos PDF para extraer campos de formulario como XML con Aspose.PDF Cloud Python SDK.
Con nuestro SDK de Python puedes
- Agregar encabezado y pie de página al documento PDF en formato de texto o imagen.
- Agregar tablas y sellos de texto o imagen a documentos PDF.
- Adjuntar varios documentos PDF a un archivo existente.
- Trabajar con archivos adjuntos, anotaciones y campos de formulario de PDF.
- Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
- Eliminar todos los sellos y tablas de una página o documento PDF completo.
- Eliminar un sello o tabla específico del documento PDF por su ID.
- Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
- Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
- Extraer varios elementos de archivos PDF y optimizar documentos PDF.
- Puedes probar nuestra App gratuita para probar la funcionalidad.
- Recursos de Aprendizaje
- Documentación
- Código Fuente
- Referencias de API
- Soporte del Producto
- Soporte Gratuito
- Soporte Pagado
- Blog
- ¿Por qué Aspose.PDF Cloud para Python?
- Lista de Clientes
- Seguridad