Obtenir des tables sur la page à partir d’un PDF avec le SDK Java
Obtenez toutes les tables sur la page d’un document PDF en utilisant l’API Java côté serveur.
Get StartedComment extraire des tables sur la page depuis un PDF via le SDK Java Cloud
Afin d’extraire des tables sur la page depuis un PDF via le SDK Java Cloud, nous utiliserons Aspose.PDF Cloud Java SDK Ce SDK Cloud vous permet de créer facilement des applications cloud de création, d’édition et de conversion de PDF en C#, ASPJava ou d’autres langages Java pour diverses plateformes cloud. Ouvrez Repository gestionnaire de paquets, recherchez Aspose.PDF Cloud et installez. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de paquets pour l’installer avec Maven.
Ajoutez le dépôt Aspose Cloud à votre fichier pom.xml
Ajouter le dépôt Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Pour installer la bibliothèque cliente API dans votre dépôt Maven local, exécutez simplement :
Installation depuis Github
mvn clean install
Pour le déployer dans un dépôt Maven distant à la place, configurez les paramètres du dépôt et exécutez :
Déployer le dépôt Maven
mvn clean deploy
Étapes pour extraire des tables sur la page depuis un PDF via le SDK Java
Les développeurs Aspose.PDF Cloud peuvent facilement charger et obtenir des tables sur la page à partir d’un PDF en quelques lignes de code.
- Créez un nouvel objet Configuration avec votre secret d’application et votre clé.
- Créez un objet pour vous connecter à l’API Cloud.
- Téléversez le PDF vers le stockage cloud.
- Extrayez les tables sur la page du PDF stocké dans le cloud en utilisant la fonction getPageTables.
- Vérifiez la réponse et consignez le résultat.
- Si l’opération a réussi, affichez les tables
Ce code d'exemple montre l'extraction de tables sur la page à partir de documents PDF
import java.io.File;
import java.nio.file.Path;
import com.google.gson.Gson;
import com.google.gson.GsonBuilder;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TableRecognized;
import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;
public class TablesExtractOnPage {
public static void perform() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
Integer PAGE_NUMBER = 1;
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// paerform actionPDF_OUTPUT
TablesRecognizedResponse response = pdfApi.getPageTables(PDF_DOCUMENT, PAGE_NUMBER, null, REMOTE_FOLDER);
if (response.getCode() != 200)
System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
System.err.println("Error: Tables not found!");
}
else {
// Show tables info...
Gson gson = new GsonBuilder().setPrettyPrinting().create();
for (TableRecognized tab : response.getTables().getList()) {
String jsonTab = gson.toJson(tab);
System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
Travailler avec les tables dans le PDF
Les tables offrent un format structuré pour présenter les données de manière systématique, facilitant ainsi la compréhension et l’analyse des informations par les lecteurs. Elles améliorent également l’attrait visuel d’un document, ajoutant professionnalisme et organisation. Lorsqu’il s’agit de données numériques ou comparatives, les tables améliorent la clarté en regroupant les informations liées dans un format facile à lire. De plus, les tables peuvent incorporer du contenu en temps réel ou généré dynamiquement, tel que des données provenant de bases de données ou de tableaux de bord d’analyse. Obtenez toutes les tables sur la page à partir de documents PDF avec Aspose.PDF Cloud Java SDK.
Avec notre bibliothèque Java, vous pouvez :
- Ajouter l’en-tête et le pied de page d’un document PDF au format texte ou image.
- Ajouter des tables et des tampons (texte ou image) aux documents PDF.
- Ajouter plusieurs documents PDF à un fichier existant.
- Travailler avec les pièces jointes PDF, les annotations et les champs de formulaire.
- Appliquer le chiffrement ou le déchiffrement aux documents PDF et définir un mot de passe.
- Supprimer tous les tampons et tables d’une page ou de l’ensemble du document PDF.
- Supprimer un tampon ou une table spécifique du document PDF par son ID.
- Remplacer une ou plusieurs occurrences de texte sur une page PDF ou dans l’ensemble du document.
- Prise en charge étendue de la conversion des documents PDF vers divers autres formats de fichiers.
- Extraire divers éléments des fichiers PDF & rendre les documents PDF optimisés. Vous pouvez essayer notre application gratuite pour extraire des tables dans des fichiers PDF en ligne et tester la fonctionnalité.
- Ressources d’apprentissage
- Documentation
- Code source
- Références API
- Support produit
- Support gratuit
- Support payant
- Blog
- Pourquoi Aspose.PDF Cloud pour Java ?
- Liste des clients
- Sécurité