HTML JPG PDF XML DOCX
  Product Family
PDF

Analyser le PDF pour extraire le texte par nom dans le SDK Java

API pour analyser des documents PDF et extraire le texte par nom en utilisant l’API Java côté serveur.

Get Started

Comment analyser des documents PDF pour extraire le texte par nom à l'aide du SDK Java Cloud

Pour analyser des documents PDF et extraire le texte par nom via le SDK Java Cloud, nous utiliserons Aspose.PDF Cloud Java SDK Ce SDK Java Cloud vous permet de créer facilement des applications de création, d’édition et de conversion de PDF basées sur le cloud en Java pour diverses plateformes cloud. Ouvrez Repository gestionnaire de paquets, recherchez Aspose.PDF Cloud et installez. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de paquets pour l’installer avec Maven.

Ajoutez le référentiel Aspose Cloud à votre fichier pom.xml

Ajouter le référentiel Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Pour installer la bibliothèque cliente API dans votre référentiel Maven local, exécutez simplement :

Installation depuis Github


    mvn clean install

Pour le déployer dans un référentiel Maven distant, configurez les paramètres du référentiel et exécutez :

Déployer le référentiel Maven


    mvn clean deploy

Étapes pour analyser un PDF et extraire le texte par nom à l'aide du SDK Java

Les développeurs Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour extraire le texte par nom. Ils n’ont besoin que de quelques lignes de code.

  1. Créez un nouvel objet Configuration avec votre secret et clé d’application
  2. Créez un objet pour se connecter à l’API Cloud
  3. Téléversez votre fichier de document
  4. Analysez les documents PDF pour extraire le texte par nom dans le stockage cloud en utilisant la fonction etTextBoxField
  5. Vérifiez la réponse et consignez le résultat
  6. Si l’opération a réussi, affichez le texte extrait
 

Ce code d'exemple montre l'analyse d'un document PDF pour extraire le texte par nom


    import java.io.File;
    import java.nio.file.Files;
    import java.nio.file.OpenOption;
    import java.nio.file.Path;
    import java.nio.file.StandardOpenOption;
    import com.google.gson.Gson;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TextBoxField;
    import com.aspose.asposecloudpdf.model.TextBoxFieldResponse;
    	

    public class ParseGetTextBoxByName {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String OUTPUT_FILE     = "parsed_text_box_field_output.json";
            String TEXT_BOX_NAME   = "_YOUR_FILED_NAME_";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // perform action
                TextBoxFieldResponse response = pdfApi.getTextBoxField(PDF_DOCUMENT, TEXT_BOX_NAME, null, REMOTE_FOLDER);
                System.out.println("TextBox fields extracted status: " + response.getStatus());

                TextBoxField fieldDef = response.getField();
                String jsonFiled = new Gson().toJson(fieldDef);

                // save json
                Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
                byte[] strToBytes = jsonFiled.getBytes();
                Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
		
                System.out.println("TextBox field successfully extracted to: '" + path + "'");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }    
 

Travailler avec l'analyse de texte dans PDF via le SDK Java

En analysant les documents PDF pour extraire le texte par nom, vous pouvez modifier le contenu du champ TextBox selon les besoins. Cela maintient la position du texte dans les documents tout en gagnant du temps et en réduisant le travail manuel. Analysez des documents PDF pour extraire le texte par nom avec Aspose.PDF Cloud Java SDK.

Avec notre SDK Java, vous pouvez

  • Ajouter l’en-tête et le pied de page d’un document PDF au format texte ou image.
  • Ajouter des tableaux et des tampons texte ou image aux documents PDF.
  • Ajouter plusieurs documents PDF à un fichier existant.
  • Travailler avec les pièces jointes PDF, les annotations et les champs de formulaire.
  • Appliquer le chiffrement ou le déchiffrement aux documents PDF et définir un mot de passe.
  • Supprimer tous les tampons et tableaux d’une page ou de l’ensemble du document PDF.
  • Supprimer un tampon ou tableau spécifique du document PDF par son ID.
  • Remplacer une ou plusieurs occurrences de texte sur une page PDF ou dans l’ensemble du document.
  • Prise en charge étendue de la conversion des documents PDF vers divers autres formats de fichier.
  • Extraire différents éléments des fichiers PDF et optimiser les documents PDF.
  • Vous pouvez essayer notre application gratuite pour tester les fonctionnalités.

  •