HTML JPG PDF XML DOCX
  Product Family
PDF

Extrair Tabelas de PDF no Node.js SDK

API para trabalhar com Tabelas em documentos PDF usando Cloud Node.js SDK

Get Started

Como obter Tabelas de PDF via Node.js SDK

Para obter Tabelas de PDF, usaremos Aspose.PDF Cloud Node.js SDK. Este Cloud SDK auxilia programadores Node.js no desenvolvimento de aplicativos baseados em nuvem para criação, anotação, edição e conversão de PDFs usando a linguagem de programação Node.js via Aspose.PDF REST API. Basta criar uma conta em Aspose para Cloud e obter as informações do seu aplicativo. Assim que tiver o App SID e a chave, você está pronto para usar o Aspose.PDF Cloud Node.js SDK.

Comando do Console do Gerenciador de Pacotes


     
    npm install asposepdfcloud --save
     
     

Passos para obter Tabelas de PDF via Cloud Node.js

Os desenvolvedores do Aspose.PDF Cloud podem facilmente carregar e obter Tabelas de PDF com apenas algumas linhas de código.

  1. Leia o arquivo PDF local.
  2. Carregue um PDF local no Aspose Cloud.
  3. Recupere e exiba todas as tabelas detectadas.
  4. Recupere e exiba uma tabela pelo seu ID.
  5. Baixe o arquivo PDF atualizado do armazenamento Aspose PDF Cloud.
 

Obter Tabelas de PDF usando Node.js


    import credentials from "../../../../Credentials/credentials.json"  with { type: "json" };
    import fs from 'node:fs/promises';
    import path from 'node:path';
    import { PdfApi } from "../../../src/api/api.js";

    const configParams = {
        LOCAL_FOLDER: "C:\\Samples\\",
        PDF_DOCUMENT_NAME: "sample.pdf",
        PAGE_NUMBER: 2,                                 // Your document page number...
        TABLE_ID: "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA",    // Your table id...
    };

    const pdfApi = new PdfApi(credentials.id, credentials.key);

    const pdfTables = {
        async uploadDocument () {
            const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
            const pdfFileData = await fs.readFile(fileNamePath);
            await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
        },
                            
        async getAllTables () {
            const resultTabs = await pdfApi.getDocumentTables(configParams.PDF_DOCUMENT_NAME);

            if (resultTabs.body.code == 200 && resultTabs.body.tables) {
                if (!Array.isArray(resultTabs.body.tables.list) || resultTabs.body.tables.list.length === 0) {
                    throw new Error("Unexpected error : tables is null or empty!!!");
                }
                this.showTablesInfo(resultTabs.body.tables.list, "All tables");
                return resultTabs.body.tables.list;
            }
            else
                console.error("Unexpected error : can't get links!!!");
        },

        async getTableById () {
            const resultTabs = await pdfApi.getTable(configParams.PDF_DOCUMENT_NAME, configParams.TABLE_ID);

            if (resultTabs.body.code == 200 && resultTabs.body.table) {
                this.showTablesInfo( [ resultTabs.body.table ], "Table by Id");
                return resultTabs.body.table;
            }
            else
                console.error("Unexpected error : can't get links!!!");
        },

        showTablesInfo(tables, prefix) {
            if (Array.isArray(tables) && tables.length > 0)
            {
                tables.forEach(function(table) {
                    console.log(prefix +" => id: '" + table.id + "', page: '" + table.pageNum + "', rows: '" + table.rowList.length + "', columns: '" + table.rowList[0].cellList.length + "'");
                });
            }
            else
                console.error("showBoormarks() error: array of tables is empty!")
        },
    }

    async function main() {
        try {
            await pdfTables.uploadDocument();
            await pdfTables.getAllTables();
            await pdfTables.getTableById();
        } catch (error) {
            console.error("Error:", error.message);
        }
    }
 

Obter Tabelas de PDF

Extrair tabelas de documentos PDF é essencial para transformar conteúdo estático e não estruturado em dados utilizáveis e estruturados. Isso permite uma análise de dados eficiente, automação, integração com sistemas empresariais e transformação digital. Este processo economiza tempo, melhora a precisão, suporta o processamento de documentos em larga escala e permite a fácil reutilização de dados em relatórios, aplicativos e auditorias. Extraia Tabelas de documentos PDF com Aspose.PDF Cloud Node.js SDK.

Com nossa biblioteca Node.js você pode:

  • Adicionar cabeçalho e rodapé de documentos PDF em formato de texto ou imagem.
  • Adicionar tabelas e selos (texto ou imagem) a documentos PDF.
  • Anexar múltiplos documentos PDF a um arquivo existente.
  • Trabalhar com anexos, anotações e campos de formulário em PDF.
  • Aplicar criptografia ou descriptografia a documentos PDF e definir uma senha.
  • Excluir todos os selos e tabelas de uma página ou de todo o documento PDF.
  • Excluir um selo ou tabela específico do documento PDF pelo seu ID.
  • Substituir instâncias únicas ou múltiplas de texto em uma página de PDF ou em todo o documento.
  • Suporte extensivo para converter documentos PDF em vários outros formatos de arquivo.
  • Extrair vários elementos de arquivos PDF e otimizar documentos PDF.
  • Você pode testar nosso Aplicativo gratuito para extrair Tabelas em arquivos PDF online e testar a funcionalidade.