HTML JPG PDF XML DOCX
  Product Family
PDF

Analizar PDF para extracción de tablas en SDK Java

API para analizar documentos PDF y extraer tablas usando la API Java del lado del servidor.

Get Started

Cómo analizar documentos PDF para extracción de tablas usando Cloud Java SDK

Para analizar documentos PDF y extraer tablas mediante Cloud Java SDK, usaremos Aspose.PDF Cloud Java SDK Este SDK Java en la nube le permite crear fácilmente aplicaciones creadoras, editoras y convertidoras de PDF basadas en la nube en lenguaje Java para diversas plataformas en la nube. Abrir Repository administrador de paquetes, busque Aspose.PDF Cloud e instale. También puede usar el siguiente comando desde la consola del Administrador de paquetes para instalarlo usando Maven.

Añada el repositorio Aspose Cloud a su archivo pom.xml de la aplicación

Añadir repositorio Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Para instalar la biblioteca cliente de la API en su repositorio Maven local, simplemente ejecute:

Instalación desde Github


    mvn clean install

Para desplegarla en un repositorio Maven remoto, configure los ajustes del repositorio y ejecute:

Desplegar repositorio Maven


    mvn clean deploy

Pasos para analizar PDF y extraer tablas usando SDK Java

Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para la extracción de tablas. Sólo se necesitan unas pocas líneas de código.

  1. Crear un nuevo objeto Configuration con su secreto y clave de aplicación
  2. Crear un objeto para conectarse a la API de la nube
  3. Subir su archivo de documento
  4. Analizar documentos PDF para extracción de tablas en el almacenamiento en la nube usando la función getDocumentTables
  5. Verificar la respuesta y registrar el resultado
  6. Si la operación fue exitosa, imprimir las tablas extraídas
 

Este código de ejemplo muestra cómo analizar un documento PDF para la extracción de tablas


    import java.io.File;
    import java.nio.file.Files;
    import java.nio.file.OpenOption;
    import java.nio.file.StandardOpenOption;
    import java.nio.file.Path;
    import com.google.gson.Gson;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class ParseGetTables {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String OUTPUT_FILE     = "parsed_tables_output.json";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // perform action
                TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null,  REMOTE_FOLDER);
                System.out.println("Tables extracted status: " + response.getStatus());

                String jsonResult = "[\n";
                for (TableRecognized tableDef : response.getTables().getList()) {
                    String jsonTable = new Gson().toJson(tableDef);
                    jsonResult += jsonTable + ",\n\n";
                }
                jsonResult +="]";

                // save json
                Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
                byte[] strToBytes = jsonResult.getBytes();
                Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
            
                System.out.println("Tables successfully extracted to: '" + path + "'");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Trabajar con el análisis de tablas en PDF mediante SDK Java

Al analizar documentos PDF para la extracción de tablas, puede modificar el contenido de las tablas según sea necesario. Esto mantiene la posición de la tabla en los documentos mientras ahorra tiempo y reduce el trabajo manual. Analice documentos PDF para extraer tablas con Aspose.PDF Cloud Java SDK.

Con nuestro SDK Java usted puede

  • Añadir encabezado y pie de página al documento PDF en formato de texto o imagen.
  • Añadir tablas y sellos de texto o imagen a documentos PDF.
  • Adjuntar varios documentos PDF a un archivo existente.
  • Trabajar con archivos adjuntos PDF, anotaciones y campos de formulario.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específicos del documento PDF por su ID.
  • Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
  • Amplio soporte para convertir documentos PDF a diversos formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar los documentos PDF.
  • Puede probar nuestra aplicación gratuita para probar la funcionalidad.

  •