HTML JPG PDF XML DOCX
  Product Family
PDF

Analyser le PDF pour extraire les champs de formulaire au format XML avec le SDK Java

API pour analyser des documents PDF afin d’extraire les champs de formulaire au format XML en utilisant l’API Java côté serveur.

Get Started

Comment analyser des documents PDF pour extraire les champs de formulaire au format XML à l'aide du SDK Java Cloud

Pour analyser des documents PDF afin d’extraire les champs de formulaire au format XML via le SDK Java Cloud, nous utiliserons Aspose.PDF Cloud Java SDK Ce SDK Java Cloud vous permet de créer facilement des applications de création, édition et conversion de PDF basées sur le cloud en langage Java pour diverses plateformes cloud. Ouvrez Repository gestionnaire de paquets, recherchez Aspose.PDF Cloud et installez. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de paquets pour l’installer avec Maven.

Ajouter le dépôt Aspose Cloud à votre fichier pom.xml de l’application

Ajouter le dépôt Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Pour installer la bibliothèque cliente de l’API dans votre dépôt Maven local, exécutez simplement :

Installation depuis Github


    mvn clean install

Pour le déployer dans un dépôt Maven distant, configurez les paramètres du dépôt et exécutez :

Déployer le dépôt Maven


    mvn clean deploy

Étapes pour analyser le PDF afin d'extraire les champs de formulaire au format XML à l'aide du SDK Java

Les développeurs Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour extraire les champs de formulaire au format XML. Les développeurs n’ont besoin que de quelques lignes de code.

  1. Créez un nouvel objet Configuration avec votre secret d’application et votre clé
  2. Créez un objet pour vous connecter à l’API Cloud
  3. Téléchargez votre fichier de document
  4. Analysez les documents PDF pour extraire les champs de formulaire au format XML dans le stockage cloud en utilisant la fonction getExportFieldsFromPdfToXmlInStorage
  5. Vérifiez la réponse et consignez le résultat
  6. Téléchargez le fichier XML localement si nécessaire
 

Ce code d'exemple montre l'analyse d'un document PDF pour extraire les champs de formulaire au format XML


    import java.io.File;
    import java.nio.file.Path;
    import java.nio.file.StandardCopyOption;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdfusecases.pages.PagesHelper;

    public class ParseFormsXml {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String XML_OUTPUT_FILE = "output_sample.xml";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                //Perform action
                File f = pdfApi.getExportFieldsFromPdfToXmlInStorage(PDF_DOCUMENT, null, REMOTE_FOLDER);

                // save file
                java.nio.file.Files.copy(Path.of(f.getPath()), Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE), StandardCopyOption.REPLACE_EXISTING);
                System.out.println(String.format("File '%s' successfully dowloaded!", Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE).toString()));                
                System.out.println("Successfully parsed PDF fields as XML ! '" + XML_OUTPUT_FILE + "'");

            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Travailler avec l'analyse des formulaires dans PDF via le SDK .NET

En analysant les documents PDF pour extraire les champs de formulaire au format XML, il est possible de vérifier systématiquement la validité et la pertinence de chaque champ de formulaire, en garantissant que toutes les références sont à jour et fonctionnelles. Pour des tâches telles que le téléchargement des champs de formulaire au format XML ou la réalisation d’analyses par lots, l’extraction des champs de formulaire permet l’automatisation, économisant du temps et réduisant l’effort manuel. Analysez les documents PDF pour extraire les champs de formulaire au format XML avec Aspose.PDF Cloud Java SDK.

Avec notre SDK Java, vous pouvez

  • Ajouter l’en-tête et le pied de page d’un document PDF au format texte ou image.
  • Ajouter des tables et des tampons texte ou image aux documents PDF.
  • Ajouter plusieurs documents PDF à un fichier existant.
  • Travailler avec les pièces jointes PDF, les annotations et les champs de formulaire.
  • Appliquer le chiffrement ou le déchiffrement aux documents PDF et définir un mot de passe.
  • Supprimer tous les timbres et tables d’une page ou de l’ensemble du document PDF.
  • Supprimer un timbre ou une table spécifique du document PDF par son ID.
  • Remplacer une ou plusieurs occurrences de texte sur une page PDF ou dans l’ensemble du document.
  • Support complet pour la conversion de documents PDF vers divers autres formats de fichier.
  • Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
  • Vous pouvez essayer notre application gratuite pour tester les fonctionnalités.

  •