Extraer Tablas de PDF en Node.js SDK

API para trabajar con Tablas en documentos PDF utilizando Cloud Node.js SDK

Get Started

Cómo obtener Tablas de PDF a través de Node.js SDK

Para obtener Tablas de PDF, utilizaremos Aspose.PDF Cloud Node.js SDK. Este SDK de la nube ayuda a los programadores de Node.js a desarrollar aplicaciones de creación, anotación, edición y conversión de PDF basadas en la nube utilizando el lenguaje de programación Node.js a través de Aspose.PDF REST API. Simplemente cree una cuenta en Aspose for Cloud y obtenga la información de su aplicación. Una vez que tenga el App SID y la clave, estará listo para probar el Aspose.PDF Cloud Node.js SDK.

Comando de la Consola del Administrador de Paquetes


     
    npm install asposepdfcloud --save
     
     

Pasos para obtener Tablas de PDF a través de Cloud Node.js

Los desarrolladores de Aspose.PDF Cloud pueden cargar y obtener fácilmente Tablas de PDF en solo unas pocas líneas de código.

  1. Lea el archivo PDF local.
  2. Cargue un PDF local a Aspose Cloud.
  3. Recupere y muestre todas las tablas detectadas.
  4. Recupere y muestre una tabla por su ID.
  5. Descargue el archivo PDF actualizado desde el almacenamiento de Aspose PDF Cloud.
 

Obtener Tablas de PDF usando Node.js


    import credentials from "../../../../Credentials/credentials.json"  with { type: "json" };
    import fs from 'node:fs/promises';
    import path from 'node:path';
    import { PdfApi } from "../../../src/api/api.js";

    const configParams = {
        LOCAL_FOLDER: "C:\\Samples\\",
        PDF_DOCUMENT_NAME: "sample.pdf",
        PAGE_NUMBER: 2,                                 // Your document page number...
        TABLE_ID: "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA",    // Your table id...
    };

    const pdfApi = new PdfApi(credentials.id, credentials.key);

    const pdfTables = {
        async uploadDocument () {
            const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
            const pdfFileData = await fs.readFile(fileNamePath);
            await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
        },
                            
        async getAllTables () {
            const resultTabs = await pdfApi.getDocumentTables(configParams.PDF_DOCUMENT_NAME);

            if (resultTabs.body.code == 200 && resultTabs.body.tables) {
                if (!Array.isArray(resultTabs.body.tables.list) || resultTabs.body.tables.list.length === 0) {
                    throw new Error("Unexpected error : tables is null or empty!!!");
                }
                this.showTablesInfo(resultTabs.body.tables.list, "All tables");
                return resultTabs.body.tables.list;
            }
            else
                console.error("Unexpected error : can't get links!!!");
        },

        async getTableById () {
            const resultTabs = await pdfApi.getTable(configParams.PDF_DOCUMENT_NAME, configParams.TABLE_ID);

            if (resultTabs.body.code == 200 && resultTabs.body.table) {
                this.showTablesInfo( [ resultTabs.body.table ], "Table by Id");
                return resultTabs.body.table;
            }
            else
                console.error("Unexpected error : can't get links!!!");
        },

        showTablesInfo(tables, prefix) {
            if (Array.isArray(tables) && tables.length > 0)
            {
                tables.forEach(function(table) {
                    console.log(prefix +" => id: '" + table.id + "', page: '" + table.pageNum + "', rows: '" + table.rowList.length + "', columns: '" + table.rowList[0].cellList.length + "'");
                });
            }
            else
                console.error("showBoormarks() error: array of tables is empty!")
        },
    }

    async function main() {
        try {
            await pdfTables.uploadDocument();
            await pdfTables.getAllTables();
            await pdfTables.getTableById();
        } catch (error) {
            console.error("Error:", error.message);
        }
    }
 

Obtener Tablas de PDF

Extraer tablas de documentos PDF es esencial para transformar contenido estático y no estructurado en datos utilizables y estructurados. Permite un análisis de datos eficiente, automatización, integración con sistemas empresariales y transformación digital. Este proceso ahorra tiempo, mejora la precisión, soporta el procesamiento de documentos a gran escala y permite la fácil reutilización de datos en informes, aplicaciones y auditorías. Extraiga Tablas de documentos PDF con Aspose.PDF Cloud Node.js SDK.

Con nuestra biblioteca de Node.js usted puede:

  • Agregar el encabezado y pie de página del documento PDF en formato de texto o imagen.
  • Agregar tablas y sellos (texto o imagen) a documentos PDF.
  • Anexar múltiples documentos PDF a un archivo existente.
  • Trabajar con archivos adjuntos de PDF, anotaciones y campos de formularios.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específico del documento PDF por su ID.
  • Reemplazar instancias individuales o múltiples de texto en una página PDF o de todo el documento.
  • Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar documentos PDF.
  • Puede probar nuestra App gratuita para extraer Tablas en archivos PDF en línea y probar la funcionalidad.