HTML JPG PDF XML DOCX
  Product Family
PDF

Obtenir des tables à partir de PDF dans le SDK Java

Obtenez toutes les tables d’un document PDF en utilisant l’API Java côté serveur.

Get Started

Comment extraire des tables d'un PDF via le SDK Java Cloud

Afin d’extraire des tables d’un PDF via le SDK Java Cloud, nous utiliserons Aspose.PDF Cloud Java SDK Ce SDK Cloud vous permet de créer facilement des applications de création, d’édition et de conversion de PDF basées sur le cloud en Java pour diverses plateformes cloud. Ouvrez Repository gestionnaire de packages, recherchez Aspose.PDF Cloud et installez-le. Vous pouvez également utiliser la commande suivante depuis la console du Gestionnaire de packages pour l’installer avec Maven.

Ajoutez le référentiel Aspose Cloud à votre fichier pom.xml

Ajouter le référentiel Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Pour installer la bibliothèque cliente API dans votre référentiel Maven local, exécutez simplement :

Installation depuis Github


    mvn clean install

Pour le déployer dans un référentiel Maven distant à la place, configurez les paramètres du référentiel et exécutez :

Déployer le référentiel Maven


    mvn clean deploy

Étapes pour extraire des tables d'un PDF via le SDK Java

Les développeurs Aspose.PDF Cloud peuvent facilement charger et obtenir des tables à partir d’un PDF en seulement quelques lignes de code.

  1. Créez un nouvel objet Configuration avec votre secret d’application et votre clé.
  2. Créez un objet pour se connecter à l’API Cloud.
  3. Téléversez le PDF dans le stockage cloud.
  4. Extrayez les tables du PDF stocké dans le cloud en utilisant la fonction getDocumentTables.
  5. Vérifiez la réponse et consignez le résultat.
  6. Si l’opération a réussi, affichez les tables
 

Ce code d'exemple montre comment extraire des tables de documents PDF


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtarctAll {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Travailler avec les tables dans les PDF

Les tables offrent un format structuré pour présenter les données de manière systématique, facilitant la compréhension et l’analyse des informations par les lecteurs. Elles améliorent également l’attrait visuel d’un document, ajoutant professionnalisme et organisation. Lors du traitement de données numériques ou comparatives, les tables améliorent la clarté en regroupant les informations liées dans un format facile à lire. De plus, les tables peuvent intégrer du contenu en temps réel ou généré dynamiquement, comme des données provenant de bases de données ou de tableaux de bord analytiques. Obtenez toutes les tables des documents PDF avec Aspose.PDF Cloud Java SDK.

Avec notre bibliothèque Java, vous pouvez :

  • Ajouter l’en-tête et le pied de page d’un document PDF au format texte ou image.
  • Ajouter des tables et des tampons (texte ou image) aux documents PDF.
  • Ajouter plusieurs documents PDF à un fichier existant.
  • Travailler avec les pièces jointes PDF, les annotations et les champs de formulaire.
  • Appliquer le chiffrement ou le déchiffrement aux documents PDF et définir un mot de passe.
  • Supprimer tous les tampons et tableaux d’une page ou d’un document PDF entier.
  • Supprimer un tampon ou tableau spécifique du document PDF par son ID.
  • Remplacer une ou plusieurs occurrences de texte sur une page PDF ou dans l’ensemble du document.
  • Prise en charge étendue de la conversion des documents PDF vers divers autres formats de fichier.
  • Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
  • Vous pouvez essayer notre application gratuite pour extraire des tableaux dans des fichiers PDF en ligne et tester la fonctionnalité.

  •