HTML JPG PDF XML DOCX
  Product Family
PDF

Analyser un PDF pour extraire du texte par nom dans Node.js SDK

API pour analyser des documents PDF afin d’extraire du texte par nom à l’aide de l’API côté serveur Node.js.

Get Started

Comment analyser des documents PDF pour extraire du texte par nom à l'aide de Cloud Node.js SDK

Pour analyser des documents PDF afin d’extraire du texte par nom via Cloud Node.js SDK, nous utiliserons Aspose.PDF Cloud Node.js SDK Ce Cloud SDK aide les programmeurs Node.js à développer des applications de création, d’annotation, d’édition, de conversion et d’analyse de PDF basées sur le cloud en utilisant le langage de programmation Node.js via Aspose.PDF REST API. Créez simplement un compte sur Aspose for Cloud et obtenez les informations de votre application. Une fois que vous avez le SID et la clé de l’application, vous êtes prêt à utiliser Aspose.PDF Cloud Node.js SDK.

Commande de la console du gestionnaire de packages


     
    npm install asposepdfcloud --save
     
     

Étapes pour analyser un PDF pour extraire du texte par nom à l'aide de Node.js SDK

Les développeurs Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour extraire du texte par nom. Les développeurs n’ont besoin que de quelques lignes de code.

  1. Créez un nouvel objet de configuration avec votre clé secrète et votre clé d’application
  2. Créez un objet pour se connecter à l’API Cloud
  3. Téléchargez votre fichier de document
  4. Analysez des documents PDF pour extraire du texte par nom dans le stockage cloud en utilisant la fonction getTextBoxField
  5. Vérifiez la réponse et enregistrez le résultat
  6. Téléchargez les informations des tables dans un fichier JSON localement si nécessaire
 

Cet exemple de code montre l'analyse d'un document PDF pour extraire du texte par nom


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTextBox};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTextBox = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, textboxName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getTextBoxField(documentName, textboxName, null, remoteFolder);
            if (response.body.code == 200) {
                console.log("ParseExportTextBox(): TextBox Filed successfully extracted!");
         	const result = JSON.stringify(response.boby.field);
                const filePath = path.join(localFolder, "parsed_text_box_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTextBox(): Unexpected error!") 

        }
    }
};
 

Travailler avec l'analyse de texte dans les PDF via Node.js SDK

En analysant des documents PDF pour l’extraction de texte par nom, vous pouvez modifier le contenu du champ TextBox selon vos besoins. Cela maintient la position du texte dans les documents tout en économisant du temps et en réduisant le travail manuel. Analysez des documents PDF pour extraire du texte par nom avec Aspose.PDF Cloud Node.js SDK.

Avec notre SDK Node.js, vous pouvez

  • Ajouter l’en-tête et le pied de page du document PDF au format texte ou image.
  • Ajouter des tables et des tampons de texte ou d’image aux documents PDF.
  • Ajouter plusieurs documents PDF à un fichier existant.
  • Travailler avec les pièces jointes, les annotations et les champs de formulaire des PDF.
  • Appliquer le cryptage ou le décryptage aux documents PDF et définir un mot de passe.
  • Supprimer tous les tampons et tables d’une page ou de l’ensemble du document PDF.
  • Supprimer un tampon ou une table spécifique du document PDF par son ID.
  • Remplacer une ou plusieurs instances de texte sur une page PDF ou dans l’ensemble du document.
  • Support étendu pour la conversion de documents PDF en divers autres formats de fichiers.
  • Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
  • Vous pouvez essayer notre application gratuite pour tester la fonctionnalité.

  •