Analyse de PDF pour l’extraction de tableaux dans le SDK Java
API pour analyser des documents PDF afin d’extraire des tableaux à l’aide d’une API Java côté serveur.
Get StartedComment analyser des documents PDF pour l'extraction de tableaux à l'aide du SDK Java Cloud
Pour analyser des documents PDF afin d’extraire des tableaux via le SDK Java Cloud, nous utiliserons Aspose.PDF Cloud Java SDK Ce SDK Java Cloud vous permet de créer facilement des applications de création, édition et conversion de PDF basées sur le cloud en langage Java pour diverses plateformes cloud. Ouvrir Repository gestionnaire de paquets, recherchez Aspose.PDF Cloud et installez-le. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de packages pour l’installer avec Maven.
Ajoutez le dépôt Aspose Cloud à votre fichier pom.xml
Ajouter le dépôt Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Pour installer la bibliothèque cliente API dans votre dépôt Maven local, exécutez simplement :
Installation depuis Github
mvn clean install
Pour le déployer dans un dépôt Maven distant à la place, configurez les paramètres du dépôt et exécutez :
Déployer le dépôt Maven
mvn clean deploy
Étapes pour analyser les PDF afin d'extraire des tableaux à l'aide du SDK Java
Les développeurs d’Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour l’extraction de tableaux. Ils n’ont besoin que de quelques lignes de code.
- Créez un nouvel objet Configuration avec votre secret d’application et votre clé
- Créez un objet pour se connecter à l’API Cloud
- Téléversez votre fichier de document
- Analysez les documents PDF pour l’extraction de tableaux dans le stockage cloud en utilisant la fonction getDocumentTables
- Vérifiez la réponse et consignez le résultat
- Si l’opération a réussi, affichez les tableaux extraits
Ce code d'exemple montre l'analyse d'un document PDF pour l'extraction de tableaux
import java.io.File;
import java.nio.file.Files;
import java.nio.file.OpenOption;
import java.nio.file.StandardOpenOption;
import java.nio.file.Path;
import com.google.gson.Gson;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TableRecognized;
import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;
public class ParseGetTables {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String OUTPUT_FILE = "parsed_tables_output.json";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// perform action
TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null, REMOTE_FOLDER);
System.out.println("Tables extracted status: " + response.getStatus());
String jsonResult = "[\n";
for (TableRecognized tableDef : response.getTables().getList()) {
String jsonTable = new Gson().toJson(tableDef);
jsonResult += jsonTable + ",\n\n";
}
jsonResult +="]";
// save json
Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
byte[] strToBytes = jsonResult.getBytes();
Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
System.out.println("Tables successfully extracted to: '" + path + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
Travailler avec l'analyse des tableaux PDF via le SDK Java
En analysant les documents PDF pour l’extraction de tableaux, vous pouvez modifier le contenu des tableaux selon les besoins. Cela préserve la position du tableau dans les documents tout en gagnant du temps et en réduisant le travail manuel. Analysez des documents PDF pour extraire des tableaux avec Aspose.PDF Cloud Java SDK.
Avec notre SDK Java, vous pouvez
- Ajouter l’en-tête et le pied de page d’un document PDF au format texte ou image.
- Ajouter des tables et des tampons texte ou image aux documents PDF.
- Ajouter plusieurs documents PDF à un fichier existant.
- Travailler avec les pièces jointes PDF, les annotations et les champs de formulaire.
- Appliquer le chiffrement ou le déchiffrement aux documents PDF et définir un mot de passe.
- Supprimer tous les tampons & tableaux d’une page ou de l’ensemble du document PDF.
- Supprimer un tampon ou tableau spécifique du document PDF par son ID.
- Remplacer une ou plusieurs occurrences de texte sur une page PDF ou dans l’ensemble du document.
- Prise en charge étendue de la conversion de documents PDF vers divers autres formats de fichier.
- Extraire divers éléments des fichiers PDF & optimiser les documents PDF.
- Vous pouvez essayer notre application gratuite pour tester les fonctionnalités.
- Ressources d'apprentissage
- Documentation
- Code source
- Références API
- Support produit
- Support gratuit
- Support payant
- Blog
- Pourquoi Aspose.PDF Cloud pour Java ?
- Liste des clients
- Sécurité