HTML JPG PDF XML DOCX
  Product Family
PDF

Analyser un PDF pour l’extraction de tableaux dans Node.js SDK

API pour analyser les documents PDF afin d’extraire des tableaux en utilisant l’API Node.js côté serveur.

Get Started

Comment analyser des documents PDF pour l'extraction de tableaux en utilisant Cloud Node.js SDK

Pour analyser des documents PDF afin d’extraire des tableaux via Cloud Node.js SDK, nous utiliserons Aspose.PDF Cloud Node.js SDK Ce SDK Cloud aide les programmeurs Node.js à développer des applications cloud de création, annotation, édition, conversion et analyse de PDF en utilisant le langage de programmation Node.js via l’API REST Aspose.PDF. Créez simplement un compte sur Aspose pour Cloud et obtenez les informations de votre application. Une fois que vous avez l’App SID et la clé, vous êtes prêt à utiliser Aspose.PDF Cloud Node.js SDK.

Commande de la console du gestionnaire de packages


     
    npm install asposepdfcloud --save
     
     

Étapes pour analyser un PDF pour l'extraction de tableaux en utilisant Node.js SDK

Les développeurs d’Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour l’extraction de tableaux. Les développeurs ne nécessitent que quelques lignes de code.

  1. Créez un nouvel objet Configuration avec votre secret d’application et votre clé
  2. Créez un objet pour se connecter à l’API Cloud
  3. Téléchargez votre fichier document
  4. Analysez les documents PDF pour l’extraction de tableaux dans le stockage cloud en utilisant la fonction getDocumentTables
  5. Vérifiez la réponse et enregistrez le résultat
  6. Téléchargez les informations des tableaux dans un fichier JSON localement si nécessaire
 

Ce code d'exemple montre l'analyse d'un document PDF pour l'extraction de tableaux


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTables};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTables = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getDocumentTables( documentName, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportTables(): Tables successfully extracted!");

                var result = "[\n";
                await Promise.all(
                    response.body.tables.list.map(async (table) => {
                        const responseTable = await pdfApi.getTable(documentName, table.id, null, remoteFolder)
                            .then(function(responseTable){
                                result += JSON.stringify(table) + ",\n\n";
                            });
                        })
                    );
                result += "]";

                const filePath = path.join(localFolder, "parsed_tables_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTables(): Unexpected error!") 

        }
    }
};
 

Travailler avec l'analyse de tableaux dans PDF via Node.js SDK

En analysant des documents PDF pour l’extraction de tableaux, vous pouvez modifier le contenu des tableaux selon vos besoins. Cela maintient la position du tableau dans les documents tout en économisant du temps et en réduisant le travail manuel. Analysez des documents PDF pour extraire des tableaux avec Aspose.PDF Cloud Node.js SDK.

Avec notre SDK Node.js, vous pouvez

  • Ajouter l’en-tête et le pied de page d’un document PDF au format texte ou image.
  • Ajouter des tableaux et des tampons texte ou image aux documents PDF.
  • Ajouter plusieurs documents PDF à un fichier existant.
  • Travailler avec les pièces jointes PDF, annotations et champs de formulaire.
  • Appliquer le chiffrement ou le déchiffrement aux documents PDF et définir un mot de passe.
  • Supprimer tous les tampons et tableaux d’une page ou d’un document PDF entier.
  • Supprimer un tampon ou un tableau spécifique du document PDF par son ID.
  • Remplacer une ou plusieurs instances de texte sur une page PDF ou dans l’ensemble du document.
  • Support étendu pour convertir des documents PDF en divers autres formats de fichiers.
  • Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
  • Vous pouvez essayer notre application gratuite pour tester la fonctionnalité.

  •