HTML JPG PDF XML DOCX
  Product Family
PDF

Extraer Tablas de PDF en Node.js SDK

API para trabajar con Tablas en documentos PDF utilizando Cloud Node.js SDK

Get Started

Cómo obtener Tablas de PDF a través de Node.js SDK

Para obtener Tablas de PDF, utilizaremos Aspose.PDF Cloud Node.js SDK. Este SDK de la nube ayuda a los programadores de Node.js a desarrollar aplicaciones de creación, anotación, edición y conversión de PDF basadas en la nube utilizando el lenguaje de programación Node.js a través de Aspose.PDF REST API. Simplemente cree una cuenta en Aspose for Cloud y obtenga la información de su aplicación. Una vez que tenga el App SID y la clave, estará listo para probar el Aspose.PDF Cloud Node.js SDK.

Comando de la Consola del Administrador de Paquetes


     
    npm install asposepdfcloud --save
     
     

Pasos para obtener Tablas de PDF a través de Cloud Node.js

Los desarrolladores de Aspose.PDF Cloud pueden cargar y obtener fácilmente Tablas de PDF en solo unas pocas líneas de código.

  1. Lea el archivo PDF local.
  2. Cargue un PDF local a Aspose Cloud.
  3. Recupere y muestre todas las tablas detectadas.
  4. Recupere y muestre una tabla por su ID.
  5. Descargue el archivo PDF actualizado desde el almacenamiento de Aspose PDF Cloud.
 

Obtener Tablas de PDF usando Node.js


    import credentials from "../../../../Credentials/credentials.json"  with { type: "json" };
    import fs from 'node:fs/promises';
    import path from 'node:path';
    import { PdfApi } from "../../../src/api/api.js";

    const configParams = {
        LOCAL_FOLDER: "C:\\Samples\\",
        PDF_DOCUMENT_NAME: "sample.pdf",
        PAGE_NUMBER: 2,                                 // Your document page number...
        TABLE_ID: "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA",    // Your table id...
    };

    const pdfApi = new PdfApi(credentials.id, credentials.key);

    const pdfTables = {
        async uploadDocument () {
            const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
            const pdfFileData = await fs.readFile(fileNamePath);
            await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
        },
                            
        async getAllTables () {
            const resultTabs = await pdfApi.getDocumentTables(configParams.PDF_DOCUMENT_NAME);

            if (resultTabs.body.code == 200 && resultTabs.body.tables) {
                if (!Array.isArray(resultTabs.body.tables.list) || resultTabs.body.tables.list.length === 0) {
                    throw new Error("Unexpected error : tables is null or empty!!!");
                }
                this.showTablesInfo(resultTabs.body.tables.list, "All tables");
                return resultTabs.body.tables.list;
            }
            else
                console.error("Unexpected error : can't get links!!!");
        },

        async getTableById () {
            const resultTabs = await pdfApi.getTable(configParams.PDF_DOCUMENT_NAME, configParams.TABLE_ID);

            if (resultTabs.body.code == 200 && resultTabs.body.table) {
                this.showTablesInfo( [ resultTabs.body.table ], "Table by Id");
                return resultTabs.body.table;
            }
            else
                console.error("Unexpected error : can't get links!!!");
        },

        showTablesInfo(tables, prefix) {
            if (Array.isArray(tables) && tables.length > 0)
            {
                tables.forEach(function(table) {
                    console.log(prefix +" => id: '" + table.id + "', page: '" + table.pageNum + "', rows: '" + table.rowList.length + "', columns: '" + table.rowList[0].cellList.length + "'");
                });
            }
            else
                console.error("showBoormarks() error: array of tables is empty!")
        },
    }

    async function main() {
        try {
            await pdfTables.uploadDocument();
            await pdfTables.getAllTables();
            await pdfTables.getTableById();
        } catch (error) {
            console.error("Error:", error.message);
        }
    }
 

Obtener Tablas de PDF

Extraer tablas de documentos PDF es esencial para transformar contenido estático y no estructurado en datos utilizables y estructurados. Permite un análisis de datos eficiente, automatización, integración con sistemas empresariales y transformación digital. Este proceso ahorra tiempo, mejora la precisión, soporta el procesamiento de documentos a gran escala y permite la fácil reutilización de datos en informes, aplicaciones y auditorías. Extraiga Tablas de documentos PDF con Aspose.PDF Cloud Node.js SDK.

Con nuestra biblioteca de Node.js usted puede:

  • Agregar el encabezado y pie de página del documento PDF en formato de texto o imagen.
  • Agregar tablas y sellos (texto o imagen) a documentos PDF.
  • Anexar múltiples documentos PDF a un archivo existente.
  • Trabajar con archivos adjuntos de PDF, anotaciones y campos de formularios.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específico del documento PDF por su ID.
  • Reemplazar instancias individuales o múltiples de texto en una página PDF o de todo el documento.
  • Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar documentos PDF.
  • Puede probar nuestra App gratuita para extraer Tablas en archivos PDF en línea y probar la funcionalidad.