PNG JPG BMP TIFF PDF
Aspose.PDF  para Python

Extrair Tabela de PDF no Python SDK

Extraia Tabelas de um Documento PDF usando Cloud usando Cloud Python SDK.

Get Started

Como extrair Tabelas de PDF via Cloud Python SDK

Para extrair tabelas de PDF, usaremos Aspose.PDF Cloud Python SDK. Este Cloud SDK ajuda programadores Python a desenvolver aplicativos criadores, anotadores, editores e conversores de PDF baseados em nuvem usando a linguagem de programação Python via Aspose.PDF REST API. Basta criar uma conta em Aspose for Cloud e obter as informações do seu aplicativo. Uma vez que você tenha o App SID & key, você está pronto para usar o Aspose.PDF Cloud Python SDK. Se o pacote python estiver hospedado no Github, você pode instalar diretamente do Github:

Instalação do Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Comando do Console do Gerenciador de Pacotes

     
    pip install asposepdfcloud

Passos para obter Tabelas de PDF via Python SDK

Os desenvolvedores do Aspose.PDF Cloud podem facilmente carregar e extrair tabelas de PDF em apenas algumas linhas de código.

  1. Instale Python SDK
  2. Faça upload de um documento PDF para o servidor Aspose Cloud
  3. Baixe o documento PDF processado do servidor Aspose Cloud
  4. Obtenha todas as tabelas
 

Extrair Tabelas de PDF usando Python


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, Table, Row, Cell, FontStyles, GraphInfo, TextRect, TextState, Color, BorderInfo
    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
        PAGE_NUMBER = 2
        TABLE_ID = "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA"

    class PdfTables:
        """ Class for managing PDF tables using Aspose PDF Cloud API. """
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """ Initialize the API client. """
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """ Upload a PDF document to the Aspose Cloud server. """
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def _show_tables_info(self, tables, prefix):
            if tables and len(tables) > 0 :
                for table in tables:
                    logging.info(f"{prefix} => id: '{table.id}', page: '{table.page_num}', rows: '{len(table.row_list)}', columns: '{len(table.row_list[0].cell_list)}'")
            else:
                logging.error(f"showBoormarks() error: array of tables is empty!")

        def get_all_tables(self):
            if self.pdf_api:
                resultTabs = self.pdf_api.get_document_tables(Config.PDF_DOCUMENT_NAME)

                if resultTabs.code == 200 and resultTabs.tables:
                    if not resultTabs.tables.list or len(resultTabs.tables.list) == 0:
                        logging.error("get_all_tables(): Unexpected error - tables is null or empty!!!")
                    self._show_tables_info(resultTabs.tables.list, "All tables")
                    return resultTabs.tables.list
                else:
                    logging.error("get_all_tables(): Unexpected error - can't get links!!!")
        
        def get_table_by_id (self):
            if self.pdf_api:
                resultTabs =self.pdf_api.get_table(Config.PDF_DOCUMENT_NAME, Config.TABLE_ID)

                if resultTabs.code == 200 and resultTabs.table:
                    self._show_tables_info( [ resultTabs.table ], "Table by Id")
                    return resultTabs.table
                else:
                    logging.error("get_table_by_id(): Unexpected error - can't get links!!!")

    if __name__ == "__main__":
        pdf_tables = PdfTables()
        pdf_tables.upload_document()
        pdf_tables.get_all_tables()
        pdf_tables.get_table_by_id()
 

Trabalhar com Tabelas em PDF

As tabelas oferecem um formato estruturado para apresentar dados de forma sistemática, facilitando para os leitores a compreensão e análise das informações. Elas também melhoram o apelo visual de um documento, adicionando profissionalismo e organização. Ao lidar com dados numéricos ou comparativos, as tabelas melhoram a clareza ao agrupar informações relacionadas em um formato de fácil leitura. Além disso, as tabelas podem incorporar conteúdo em tempo real ou gerado dinamicamente, como dados de bancos de dados ou painéis de análise. Extraia a Tabela de documentos PDF com Aspose.PDF Cloud Python SDK.

Com nossa biblioteca Python você pode:

  • Combinar documentos PDF.
  • Dividir Arquivos PDF.
  • Converter PDF para outros formatos e vice-versa.
  • Manipular Anotações.
  • Trabalhar com Imagens em PDF, etc.
  • Você pode experimentar nosso App gratuito para testar a funcionalidade online.