Analyser des PDF pour extraire des textes dans Node.js SDK
API pour analyser des documents PDF afin d’extraire des textes en utilisant l’API serveur Node.js.
Get StartedComment analyser des documents PDF pour extraire des textes en utilisant Cloud Node.js SDK
Pour analyser des documents PDF afin d’extraire des textes via Cloud Node.js SDK, nous utiliserons Aspose.PDF Cloud Node.js SDK Ce SDK Cloud aide les programmeurs Node.js à développer des applications de création, annotation, édition, conversion et analyse de PDF basées sur le cloud en utilisant le langage de programmation Node.js via l’API REST Aspose.PDF. Créez simplement un compte à Aspose for Cloud et obtenez les informations de votre application. Une fois que vous avez l’App SID & la clé, vous êtes prêt à utiliser Aspose.PDF Cloud Node.js SDK.
Commande de la console du gestionnaire de packages
npm install asposepdfcloud --save
Étapes pour analyser un PDF afin d'extraire des textes en utilisant Node.js SDK
Les développeurs Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour extraire des textes. Les développeurs n’ont besoin que de quelques lignes de code.
- Créez un nouvel objet Configuration avec votre secret d’application et clé
- Créez un objet pour se connecter à l’API Cloud
- Téléchargez votre fichier de document
- Analysez les documents PDF pour extraire des textes dans le stockage cloud en utilisant la fonction getDocumentTextBoxFields
- Vérifiez la réponse et enregistrez le résultat
- Téléchargez les informations des boîtes de texte dans un fichier JSON localement si nécessaire
Ce code d'exemple montre l'analyse de document PDF pour extraire des textes
import fs from 'node:fs/promises';
import path from 'node:path';
export {ParseExportTextBoxes};
const pdfApi = new PdfApi(APP_SID, APP_KEY);
const ParseExportTextBoxes = {
async uploadDocument (documentName, localFolder, tempFolder) {
const fileNamePath = path.join(localFolder, documentName);
const fileData = await fs.readFile(fileNamePath);
const storagePath = path.join(tempFolder, documentName);
await pdfApi.uploadFile(storagePath, fileData)
.then(() => console.log("File: '" + documentName +"' successfully uploaded."));
},
async export(documentName, localFolder, remoteFolder) {
if ( pdfApi ) {
await uploadDocument(documentName, localFolder, remoteFolder);
const response = await pdfApi.getDocumentTextBoxFields( documentName, null, remoteFolder );
if (response.body.code == 200) {
console.log("ParseExportTextBoxes(): TextBox Fileds successfully extracted!");
var result = "[\n";
await Promise.all(
response.body.fields.list.map(async (textbox) => {
const responseText = await pdfApi.getTextBoxField(documentName, textbox.fullName, null, remoteFolder)
.then(function(responseTextBox){
result += JSON.stringify(textbox) + ",\n\n";
});
})
);
result += "]";
const filePath = path.join(localFolder, "parsed_text_boxes_output.json");
await fs.writeFile(filePath, result);
console.log("Downloaded: " + filePath);
}
else
console.error("ParseExportTextBoxes(): Unexpected error!")
}
}
};
Travailler avec l'analyse de textes dans PDF via Node.js SDK
En analysant des documents PDF pour extraire des textes, vous pouvez modifier le contenu des champs TextBox selon les besoins. Cela maintient la position du texte dans les documents tout en économisant du temps et en réduisant le travail manuel. Analysez des documents PDF pour extraire des textes avec Aspose.PDF Cloud Node.js SDK.
Avec notre SDK Node.js, vous pouvez
- Ajouter l’en-tête et le pied de page du document PDF en format texte ou image.
- Ajouter des tables & des tampons de texte ou d’image aux documents PDF.
- Ajouter plusieurs documents PDF à un fichier existant.
- Travailler avec les pièces jointes, annotations & champs de formulaire PDF.
- Appliquer le cryptage ou le décryptage aux documents PDF & définir un mot de passe.
- Supprimer tous les tampons & tables d’une page ou d’un document PDF entier.
- Supprimer un tampon ou une table spécifique du document PDF par son ID.
- Remplacer une ou plusieurs instances de texte sur une page PDF ou dans tout le document.
- Support étendu pour la conversion de documents PDF en divers autres formats de fichiers.
- Extraire divers éléments des fichiers PDF & optimiser les documents PDF.
- Vous pouvez essayer notre application gratuite pour tester la fonctionnalité.
- Ressources d'apprentissage
- Documentation
- Code Source
- Références API
- Support Produit
- Support Gratuit
- Support Payant
- Blog
- Pourquoi Aspose.PDF Cloud pour Node.js ?
- Liste des Clients
- Sécurité