Extraire des tableaux d’un PDF dans Node.js SDK
API pour travailler avec des tableaux dans des documents PDF en utilisant Cloud Node.js SDK
Get StartedComment obtenir des tableaux d'un PDF via Node.js SDK
Pour obtenir des tableaux à partir d’un PDF, nous utiliserons Aspose.PDF Cloud Node.js SDK. Ce SDK Cloud aide les programmeurs Node.js à développer des applications créatrices, annotatrices, éditrices et convertisseuses de PDF basées sur le cloud en utilisant le langage de programmation Node.js via l’API REST Aspose.PDF. Créez simplement un compte sur Aspose for Cloud et obtenez les informations de votre application. Une fois que vous avez le SID de l’application et la clé, vous êtes prêt à utiliser le Aspose.PDF Cloud Node.js SDK.
Commande de la console du gestionnaire de paquets
npm install asposepdfcloud --save
Étapes pour obtenir des tableaux à partir d'un PDF via Cloud Node.js
Les développeurs Aspose.PDF Cloud peuvent facilement charger et obtenir des tableaux à partir d’un PDF en quelques lignes de code.
- Lire le fichier PDF local.
- Télécharger un PDF local vers Aspose Cloud.
- Récupérer et afficher tous les tableaux détectés.
- Récupérer et afficher un tableau par son ID.
- Télécharger le fichier PDF mis à jour depuis le stockage Aspose PDF Cloud.
Obtenir des tableaux à partir d'un PDF en utilisant Node.js
import credentials from "../../../../Credentials/credentials.json" with { type: "json" };
import fs from 'node:fs/promises';
import path from 'node:path';
import { PdfApi } from "../../../src/api/api.js";
const configParams = {
LOCAL_FOLDER: "C:\\Samples\\",
PDF_DOCUMENT_NAME: "sample.pdf",
PAGE_NUMBER: 2, // Your document page number...
TABLE_ID: "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA", // Your table id...
};
const pdfApi = new PdfApi(credentials.id, credentials.key);
const pdfTables = {
async uploadDocument () {
const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
const pdfFileData = await fs.readFile(fileNamePath);
await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
},
async getAllTables () {
const resultTabs = await pdfApi.getDocumentTables(configParams.PDF_DOCUMENT_NAME);
if (resultTabs.body.code == 200 && resultTabs.body.tables) {
if (!Array.isArray(resultTabs.body.tables.list) || resultTabs.body.tables.list.length === 0) {
throw new Error("Unexpected error : tables is null or empty!!!");
}
this.showTablesInfo(resultTabs.body.tables.list, "All tables");
return resultTabs.body.tables.list;
}
else
console.error("Unexpected error : can't get links!!!");
},
async getTableById () {
const resultTabs = await pdfApi.getTable(configParams.PDF_DOCUMENT_NAME, configParams.TABLE_ID);
if (resultTabs.body.code == 200 && resultTabs.body.table) {
this.showTablesInfo( [ resultTabs.body.table ], "Table by Id");
return resultTabs.body.table;
}
else
console.error("Unexpected error : can't get links!!!");
},
showTablesInfo(tables, prefix) {
if (Array.isArray(tables) && tables.length > 0)
{
tables.forEach(function(table) {
console.log(prefix +" => id: '" + table.id + "', page: '" + table.pageNum + "', rows: '" + table.rowList.length + "', columns: '" + table.rowList[0].cellList.length + "'");
});
}
else
console.error("showBoormarks() error: array of tables is empty!")
},
}
async function main() {
try {
await pdfTables.uploadDocument();
await pdfTables.getAllTables();
await pdfTables.getTableById();
} catch (error) {
console.error("Error:", error.message);
}
}
Obtenir des tableaux à partir d'un PDF
Extraire des tableaux de documents PDF est essentiel pour transformer du contenu statique et non structuré en données utilisables et structurées. Cela permet une analyse de données efficace, l’automatisation, l’intégration avec des systèmes d’entreprise et la transformation numérique. Ce processus permet de gagner du temps, d’améliorer la précision, de prendre en charge le traitement de documents à grande échelle et de permettre la réutilisation facile des données dans des rapports, applications et audits. Extraire des tableaux de documents PDF avec Aspose.PDF Cloud Node.js SDK.
Avec notre bibliothèque Node.js, vous pouvez :
- Ajouter l’en-tête et le pied de page d’un document PDF en format texte ou image.
- Ajouter des tableaux et des tampons (texte ou image) aux documents PDF.
- Ajouter plusieurs documents PDF à un fichier existant.
- Travailler avec des pièces jointes, annotations et champs de formulaire des PDF.
- Appliquer le chiffrement ou le déchiffrement aux documents PDF et définir un mot de passe.
- Supprimer tous les tampons et tableaux d’une page ou de l’ensemble du document PDF.
- Supprimer un tampon ou un tableau spécifique du document PDF par son ID.
- Remplacer une ou plusieurs instances de texte sur une page PDF ou dans l’ensemble du document.
- Support étendu pour convertir des documents PDF en divers autres formats de fichier.
- Extraire divers éléments de fichiers PDF et optimiser les documents PDF.
- Vous pouvez essayer notre application gratuite pour extraire des tableaux dans des fichiers PDF en ligne et tester la fonctionnalité.
- Ressources d'apprentissage
- Documentation
- Code Source
- Références API
- Support Produit
- Support Gratuit
- Support Payant
- Blog
- Pourquoi Aspose.PDF Cloud pour Node.js ?
- Liste des Clients
- Sécurité