HTML JPG PDF XML DOCX
  Product Family
PDF

Analizar PDF para extraer campos de formulario como XML en el SDK de Java

API para analizar documentos PDF y extraer campos de formulario como XML utilizando la API Java del lado del servidor.

Get Started

Cómo analizar documentos PDF para extraer campos de formulario como XML usando Cloud Java SDK

Para analizar documentos PDF y extraer campos de formulario como XML mediante Cloud Java SDK, utilizaremos Aspose.PDF Cloud Java SDK Este SDK Java en la nube le permite crear fácilmente aplicaciones de creador, editor y conversor de PDF basadas en la nube en lenguaje Java para varias plataformas en la nube. Abrir Repository administrador de paquetes, busque Aspose.PDF Cloud e instale. También puede usar el siguiente comando desde la consola del Administrador de paquetes para instalarlo usando Maven.

Agregue el repositorio Aspose Cloud a su archivo pom.xml

Agregar repositorio Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Para instalar la biblioteca cliente de la API en su repositorio Maven local, simplemente ejecute:

Instalación desde Github


    mvn clean install

Para desplegarlo en un repositorio Maven remoto, configure los ajustes del repositorio y ejecute:

Desplegar repositorio Maven


    mvn clean deploy

Pasos para analizar PDF y extraer campos de formulario como XML usando el SDK Java

Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer campos de formulario como XML. Los desarrolladores solo necesitan unas pocas líneas de código.

  1. Crear un nuevo objeto Configuration con su secreto y clave de aplicación
  2. Crear un objeto para conectar con la API de la nube
  3. Subir su archivo de documento
  4. Analizar documentos PDF para extraer campos de formulario como XML en el almacenamiento en la nube usando la función getExportFieldsFromPdfToXmlInStorage
  5. Verificar la respuesta y registrar el resultado
  6. Descargar el archivo XML localmente si es necesario
 

Este código de ejemplo muestra cómo analizar un documento PDF para extraer campos de formulario como XML


    import java.io.File;
    import java.nio.file.Path;
    import java.nio.file.StandardCopyOption;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdfusecases.pages.PagesHelper;

    public class ParseFormsXml {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String XML_OUTPUT_FILE = "output_sample.xml";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                //Perform action
                File f = pdfApi.getExportFieldsFromPdfToXmlInStorage(PDF_DOCUMENT, null, REMOTE_FOLDER);

                // save file
                java.nio.file.Files.copy(Path.of(f.getPath()), Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE), StandardCopyOption.REPLACE_EXISTING);
                System.out.println(String.format("File '%s' successfully dowloaded!", Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE).toString()));                
                System.out.println("Successfully parsed PDF fields as XML ! '" + XML_OUTPUT_FILE + "'");

            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Trabajar con el análisis de formularios en PDF mediante el SDK .NET

Al analizar documentos PDF para extraer campos de formulario como XML, se puede verificar sistemáticamente la validez y relevancia de cada campo de formulario, asegurando que todas las referencias estén actuales y funcionales. Para tareas como descargar campos de formulario como XML o realizar análisis por lotes, la extracción de campos de formulario permite la automatización, ahorrando tiempo y reduciendo el esfuerzo manual. Analice documentos PDF para extraer campos de formulario como XML con Aspose.PDF Cloud Java SDK.

Con nuestro SDK Java puedes

  • Añadir encabezado y pie de página al documento PDF en formato de texto o imagen.
  • Añadir tablas y sellos de texto o imagen a documentos PDF.
  • Adjuntar múltiples documentos PDF a un archivo existente.
  • Trabajar con adjuntos PDF, anotaciones y campos de formulario.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específicos del documento PDF por su ID.
  • Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
  • Soporte amplio para convertir documentos PDF a varios formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar los documentos PDF.
  • Puede probar nuestra aplicación gratuita para probar la funcionalidad.

  •