Analisar PDF para extração de Texto por nome no Python SDK
API para analisar documentos PDF para extração de texto por nome usando API Python do lado do servidor.
Get StartedComo analisar documentos PDF para extração de Texto por nome usando Cloud Python SDK
Para analisar documentos PDF para extração de Texto por nome via Cloud Python SDK, usaremos Aspose.PDF Cloud Python SDK Este Cloud SDK auxilia programadores Python no desenvolvimento de aplicativos criadores, anotadores, editores, conversores e analisadores de PDF baseados em nuvem usando a linguagem de programação Python via Aspose.PDF REST API. Simplesmente crie uma conta em Aspose for Cloud e obtenha suas informações de aplicação. Uma vez que você tenha o SID e a chave do App, você está pronto para usar o Aspose.PDF Cloud Python SDK. Se o pacote Python estiver hospedado no Github, você pode instalar diretamente do Github:
Instalação do Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Passos para analisar PDF para extração de Texto por nome usando Python SDK
Desenvolvedores Aspose.PDF Cloud podem facilmente analisar documentos PDF para extração de Texto por nome. Os desenvolvedores precisam de apenas algumas linhas de código.
- Crie um novo objeto de Configuração com seu Segredo e Chave da Aplicação
- Crie um objeto para conectar-se à API Cloud
- Carregue seu arquivo de documento
- Analise documentos PDF para extração de Texto por nome no armazenamento em nuvem usando a função get_text_box_field
- Verifique a resposta e registre o resultado
- Baixe as informações da Caixa de Texto em um arquivo JSON localmente, se necessário
Este código de exemplo mostra a análise de documento PDF para extração de Texto por nome
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class ParseExtractTextBox:
"""Class for extracting text box from PDF document using Aspose PDF Cloud API."""
def __init__(self):
self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)
def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = localFolder / documentName
try:
if remoteFolder == None:
self.pdf_api.upload_file(documentName, str(file_path))
else:
opts = { "folder": remoteFolder }
self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
logging.info(f"File {documentName} uploaded successfully.")
except Exception as e:
logging.error(f"Failed to upload file: {e}")
def Extract(self, documentName: str, texxtboxName: str, localFolder: Path, remoteFolder: Path):
self.upload_document(documentName, remoteFolder)
opts = {
"folder": remoteFolder
}
response = self.pdf_api.get_text_box_field(documentName, textboxName, **opts)
if response.code != 200:
logging.error("ParseExtractTextBox(): Unexpected error!")
else:
logging.info(f"ParseExtractTextBox(): TextBox field '{textboxName}' successfully extracted from the document '{documentName}'.")
localJsonFile = str(Path.joinpath(localFolder, "text_box_objects.json"))
with open(localJsonFile, "w", encoding="utf-8") as localFile:
jsText = json.dumps(response.field.__dict__, ensure_ascii=False, default=str, indent=4)
localFile.write(jsText)
Trabalhe com a análise de Texto em PDF via Python SDK
Ao analisar documentos PDF para extração de texto por nome, você pode modificar o conteúdo do campo TextBox conforme necessário. Isso mantém a posição do texto nos documentos enquanto economiza tempo e reduz o trabalho manual. Analise documentos PDF para extração de texto por nome com Aspose.PDF Cloud Python SDK.
Com nosso SDK Python você pode
- Adicionar cabeçalho e rodapé ao documento PDF em formato de texto ou imagem.
- Adicionar tabelas e selos de texto ou imagem aos documentos PDF.
- Anexar múltiplos documentos PDF a um arquivo existente.
- Trabalhar com anexos de PDF, anotações e campos de formulário.
- Aplicar criptografia ou descriptografia a documentos PDF e definir uma senha.
- Excluir todos os selos e tabelas de uma página ou de todo o documento PDF.
- Excluir um selo ou tabela específico do documento PDF pelo seu ID.
- Substituir uma ou várias ocorrências de texto em uma página PDF ou de todo o documento.
- Suporte extenso para converter documentos PDF para vários outros formatos de arquivo.
- Extrair vários elementos de arquivos PDF e otimizar documentos PDF.
- Você pode testar nossa aplicação gratuita para experimentar a funcionalidade.
- Recursos de Aprendizagem
- Documentação
- Código Fonte
- Referências da API
- Suporte ao Produto
- Suporte Gratuito
- Suporte Pago
- Blog
- Por que Aspose.PDF Cloud para Python?
- Lista de Clientes
- Segurança