HTML JPG PDF XML DOCX
  Product Family
PDF

Analizar PDF para extraer texto por nombre en Java SDK

API para analizar documentos PDF y extraer texto por nombre usando la API Java del lado del servidor.

Get Started

Cómo analizar documentos PDF para extraer texto por nombre usando Cloud Java SDK

Para analizar documentos PDF y extraer texto por nombre mediante Cloud Java SDK, utilizaremos Aspose.PDF Cloud Java SDK Este Cloud Java SDK le permite crear fácilmente aplicaciones basadas en la nube para crear, editar y convertir PDF en lenguaje Java para diversas plataformas en la nube. Abrir Repository administrador de paquetes, busque Aspose.PDF Cloud e instale. También puede usar el siguiente comando desde la Consola del Administrador de Paquetes para instalarlo usando Maven.

Agregar el repositorio Aspose Cloud a su archivo pom.xml de la aplicación

Agregar repositorio Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Para instalar la biblioteca cliente de la API en su repositorio Maven local, simplemente ejecute:

Instalación desde Github


    mvn clean install

Para implementarlo en un repositorio Maven remoto, configure los ajustes del repositorio y ejecute:

Desplegar repositorio Maven


    mvn clean deploy

Pasos para analizar PDF y extraer texto por nombre usando Java SDK

Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer texto por nombre. Los desarrolladores solo necesitan unas pocas líneas de código.

  1. Crear un nuevo objeto Configuration con su secreto y clave de aplicación
  2. Crear un objeto para conectarse a la API Cloud
  3. Subir su archivo de documento
  4. Analizar documentos PDF para extraer texto por nombre en el almacenamiento en la nube usando la función etTextBoxField
  5. Verificar la respuesta y registrar el resultado
  6. Si la operación fue exitosa, imprimir el texto extraído
 

Este código de ejemplo muestra cómo analizar un documento PDF para extraer texto por nombre


    import java.io.File;
    import java.nio.file.Files;
    import java.nio.file.OpenOption;
    import java.nio.file.Path;
    import java.nio.file.StandardOpenOption;
    import com.google.gson.Gson;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TextBoxField;
    import com.aspose.asposecloudpdf.model.TextBoxFieldResponse;
    	

    public class ParseGetTextBoxByName {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String OUTPUT_FILE     = "parsed_text_box_field_output.json";
            String TEXT_BOX_NAME   = "_YOUR_FILED_NAME_";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // perform action
                TextBoxFieldResponse response = pdfApi.getTextBoxField(PDF_DOCUMENT, TEXT_BOX_NAME, null, REMOTE_FOLDER);
                System.out.println("TextBox fields extracted status: " + response.getStatus());

                TextBoxField fieldDef = response.getField();
                String jsonFiled = new Gson().toJson(fieldDef);

                // save json
                Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
                byte[] strToBytes = jsonFiled.getBytes();
                Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
		
                System.out.println("TextBox field successfully extracted to: '" + path + "'");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }    
 

Trabaje con el análisis de texto en PDF mediante Java SDK

Al analizar documentos PDF para la extracción de texto por nombre, puede modificar el contenido del campo TextBox según sea necesario. Esto mantiene la posición del texto en los documentos, ahorrando tiempo y reduciendo el trabajo manual. Analice documentos PDF para extraer texto por nombre con Aspose.PDF Cloud Java SDK.

Con nuestro SDK Java usted puede

  • Añadir encabezado y pie de página del documento PDF en formato de texto o imagen.
  • Añadir tablas y sellos de texto o imagen a los documentos PDF.
  • Añadir varios documentos PDF a un archivo existente.
  • Trabajar con archivos adjuntos PDF, anotaciones y campos de formulario.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específico del documento PDF por su ID.
  • Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
  • Amplio soporte para convertir documentos PDF a varios formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar los documentos PDF.
  • Puede probar nuestra aplicación gratuita para probar la funcionalidad.

  •