HTML JPG PDF XML DOCX
  Product Family
PDF

Analisar PDF para extração de campos de formulário como XML no Python SDK

API para analisar documentos PDF para extrair campos de formulário como XML usando API Python do lado do servidor.

Get Started

Como analisar documentos PDF para extração de campos de formulário como XML usando Cloud Python SDK

Para analisar documentos PDF para extrair campos de formulário como XML via Cloud Python SDK, usaremos Aspose.PDF Cloud Python SDK Este Cloud SDK auxilia programadores Python a desenvolver aplicativos baseados em nuvem para criador, anotador, editor, conversor e analisador de PDF usando a linguagem de programação Python via Aspose.PDF REST API. Basta criar uma conta no Aspose for Cloud e obter suas informações de aplicativo. Uma vez que você tenha o App SID & key, você está pronto para usar o Aspose.PDF Cloud Python SDK. Se o pacote python estiver hospedado no Github, você pode instalar diretamente do Github:

Instalação do Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Comando do Console do Gerenciador de Pacotes

     
    pip install asposepdfcloud

Etapas para analisar PDF para extração de campos de formulário como XML usando Python SDK

Os desenvolvedores do Aspose.PDF Cloud podem facilmente analisar documentos PDF para extração de campos de formulário como XML. Os desenvolvedores precisam de apenas algumas linhas de código.

  1. Crie um novo objeto de Configuração com seu Segredo e Chave de Aplicação
  2. Crie um objeto para se conectar à API da Nuvem
  3. Faça upload do seu arquivo de documento
  4. Analise documentos PDF para extração de campos de formulário como XML no armazenamento em nuvem usando a função put_export_fields_from_pdf_to_xml_in_storage
  5. Verifique a resposta e registre o resultado
  6. Baixe o arquivo XML localmente, se necessário
 

Este código de exemplo mostra a análise de documento PDF para extrair campos de formulário como XML


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ExportFormToXML:
    """Class for extracting PDF form fields into XML using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str,  output_prefix: str):
        """Download the processed PDF document from the Aspose Cloud server."""
        if self.pdf_api:
            try:
                temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
                local_path = localFolder / ( output_prefix + outputDocument )
                shutil.move(temp_file, str(local_path))
                logging.info(f"download_result(): File successfully downloaded: {local_path}")
            except Exception as e:
                logging.error(f"download_result(): Failed to download file: {e}")


    def Extract(self, documentName: str, outputXMLName: str, localFolder: Path, remoteFolder: str ):
        self.uploadDocument(documentName, remoteFolder)

        XMLPath = str(Path.joinpath(Path(remoteFolder), outputXMLName))
        opts = {
            "folder": remoteFolder
        }
        response = self.pdf_put_export_fields_from_pdf_to_xml_in_storage(documentName, XMLPath, **opts)
        if response.code != 200:
            logging.error("ExportFormToXML(): Unexpected error!")
        else:
            logging.info(f"ExportFormToXML(): Pdf document '{documentName}' form fields successfully exported to '{outputXMLName}' file.")
            self.downloadFile(outputXMLName, outputXMLName, localFolder, remoteFolder, "")
 

Trabalhar com a análise de Formulários em PDF via Python SDK

Ao analisar documentos PDF para extração de campos de formulário como XML, pode-se verificar sistematicamente a validade e a relevância de cada campo de formulário, garantindo que todas as referências estejam atuais e funcionais.​ Para tarefas como baixar campos de formulário como XML ou realizar análises em lote, extrair campos de formulário permite automação, economizando tempo e reduzindo o esforço manual. Analise documentos PDF para extrair campos de formulário como XML com Aspose.PDF Cloud Python SDK.

Com nosso SDK Python você pode

  • Adicionar cabeçalho & rodapé de documento PDF em formato de texto ou imagem.
  • Adicionar tabelas & carimbos de texto ou imagem a documentos PDF.
  • Anexar vários documentos PDF a um arquivo existente.
  • Trabalhar com anexos, anotações e campos de formulário de PDF.
  • Aplicar criptografia ou descriptografia a documentos PDF e definir uma senha.
  • Excluir todos os carimbos & tabelas de uma página ou documento PDF inteiro.
  • Excluir um carimbo ou tabela específico do documento PDF pelo seu ID.
  • Substituir uma ou várias instâncias de texto em uma página PDF ou em todo o documento.
  • Suporte extensivo para converter documentos PDF em vários outros formatos de arquivo.
  • Extrair vários elementos de arquivos PDF e otimizar documentos PDF.
  • Você pode experimentar nosso App gratuito para testar a funcionalidade.

  •