HTML JPG PDF XML DOCX
  Product Family
PDF

Obtener tablas en página de PDF con SDK Java

Obtener todas las tablas en página de un documento PDF usando la API Java del lado del servidor.

Get Started

Cómo extraer tablas en página de PDF mediante SDK Java en la nube

Para extraer tablas en página de PDF mediante SDK Java en la nube, utilizaremos Aspose.PDF Cloud Java SDK Este SDK en la nube le permite crear fácilmente aplicaciones creadoras, editoras y convertidoras de PDF basadas en la nube en C#, ASPJava o en otros lenguajes Java para diversas plataformas en la nube. Abrir Repository administrador de paquetes, busque Aspose.PDF Cloud e instálelo. También puede usar el siguiente comando desde la consola del Administrador de paquetes para instalarlo usando Maven.

Agregar el repositorio Aspose Cloud a su archivo pom.xml de la aplicación

Agregar el repositorio Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Para instalar la biblioteca cliente de la API en su repositorio Maven local, simplemente ejecute:

Instalación desde Github


    mvn clean install

Para desplegarlo en un repositorio Maven remoto, configure los ajustes del repositorio y ejecute:

Desplegar repositorio Maven


    mvn clean deploy

Pasos para extraer tablas en página de PDF mediante SDK Java

Los desarrolladores de Aspose.PDF Cloud pueden cargar y obtener tablas en página de PDF fácilmente en tan solo unas pocas líneas de código.

  1. Crear un nuevo objeto Configuration con su secreto y clave de aplicación.
  2. Crear un objeto para conectarse a la API de la nube.
  3. Cargar el PDF al almacenamiento en la nube.
  4. Extraer tablas en página de PDF en el almacenamiento en la nube usando la función getPageTables.
  5. Verificar la respuesta y registrar el resultado.
  6. Si la operación fue exitosa, imprimir las tablas
 

Este código de ejemplo muestra la extracción de tablas en página de documentos PDF


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtractOnPage {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
            Integer PAGE_NUMBER    = 1;

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getPageTables(PDF_DOCUMENT, PAGE_NUMBER, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Trabajar con tablas en PDF

Las tablas proporcionan un formato estructurado para presentar datos de manera sistemática, facilitando la comprensión y el análisis de la información por parte de los lectores. También mejoran la apariencia visual de un documento, añadiendo profesionalismo y organización. Cuando se trata de datos numéricos o comparativos, las tablas mejoran la claridad al agrupar información relacionada en un formato fácil de leer. Además, las tablas pueden incorporar contenido en tiempo real o generado dinámicamente, como datos de bases de datos o paneles analíticos. Obtenga todas las tablas en página de documentos PDF con Aspose.PDF Cloud Java SDK.

Con nuestra biblioteca Java puede:

  • Añadir encabezado y pie de página del documento PDF en formato de texto o imagen.
  • Añadir tablas y sellos (texto o imagen) a documentos PDF.
  • Añadir varios documentos PDF a un archivo existente.
  • Trabajar con adjuntos PDF, anotaciones y campos de formulario.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específicos del documento PDF por su ID.
  • Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
  • Amplio soporte para convertir documentos PDF a varios formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar los documentos PDF.
  • Puedes probar nuestra aplicación gratuita para extraer tablas en archivos PDF en línea y probar la funcionalidad.

  •