Analizar PDF para extraer texto por nombre en Java SDK
API para analizar documentos PDF y extraer texto por nombre usando la API Java del lado del servidor.
Get StartedCómo analizar documentos PDF para extraer texto por nombre usando Cloud Java SDK
Para analizar documentos PDF y extraer texto por nombre mediante Cloud Java SDK, utilizaremos Aspose.PDF Cloud Java SDK Este Cloud Java SDK le permite crear fácilmente aplicaciones basadas en la nube para crear, editar y convertir PDF en lenguaje Java para diversas plataformas en la nube. Abrir Repository administrador de paquetes, busque Aspose.PDF Cloud e instale. También puede usar el siguiente comando desde la Consola del Administrador de Paquetes para instalarlo usando Maven.
Agregar el repositorio Aspose Cloud a su archivo pom.xml de la aplicación
Agregar repositorio Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Para instalar la biblioteca cliente de la API en su repositorio Maven local, simplemente ejecute:
Instalación desde Github
mvn clean install
Para implementarlo en un repositorio Maven remoto, configure los ajustes del repositorio y ejecute:
Desplegar repositorio Maven
mvn clean deploy
Pasos para analizar PDF y extraer texto por nombre usando Java SDK
Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer texto por nombre. Los desarrolladores solo necesitan unas pocas líneas de código.
- Crear un nuevo objeto Configuration con su secreto y clave de aplicación
- Crear un objeto para conectarse a la API Cloud
- Subir su archivo de documento
- Analizar documentos PDF para extraer texto por nombre en el almacenamiento en la nube usando la función etTextBoxField
- Verificar la respuesta y registrar el resultado
- Si la operación fue exitosa, imprimir el texto extraído
Este código de ejemplo muestra cómo analizar un documento PDF para extraer texto por nombre
import java.io.File;
import java.nio.file.Files;
import java.nio.file.OpenOption;
import java.nio.file.Path;
import java.nio.file.StandardOpenOption;
import com.google.gson.Gson;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TextBoxField;
import com.aspose.asposecloudpdf.model.TextBoxFieldResponse;
public class ParseGetTextBoxByName {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String OUTPUT_FILE = "parsed_text_box_field_output.json";
String TEXT_BOX_NAME = "_YOUR_FILED_NAME_";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// perform action
TextBoxFieldResponse response = pdfApi.getTextBoxField(PDF_DOCUMENT, TEXT_BOX_NAME, null, REMOTE_FOLDER);
System.out.println("TextBox fields extracted status: " + response.getStatus());
TextBoxField fieldDef = response.getField();
String jsonFiled = new Gson().toJson(fieldDef);
// save json
Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
byte[] strToBytes = jsonFiled.getBytes();
Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
System.out.println("TextBox field successfully extracted to: '" + path + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
Trabaje con el análisis de texto en PDF mediante Java SDK
Al analizar documentos PDF para la extracción de texto por nombre, puede modificar el contenido del campo TextBox según sea necesario. Esto mantiene la posición del texto en los documentos, ahorrando tiempo y reduciendo el trabajo manual. Analice documentos PDF para extraer texto por nombre con Aspose.PDF Cloud Java SDK.
Con nuestro SDK Java usted puede
- Añadir encabezado y pie de página del documento PDF en formato de texto o imagen.
- Añadir tablas y sellos de texto o imagen a los documentos PDF.
- Añadir varios documentos PDF a un archivo existente.
- Trabajar con archivos adjuntos PDF, anotaciones y campos de formulario.
- Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
- Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
- Eliminar un sello o tabla específico del documento PDF por su ID.
- Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
- Amplio soporte para convertir documentos PDF a varios formatos de archivo.
- Extraer varios elementos de archivos PDF y optimizar los documentos PDF.
- Puede probar nuestra aplicación gratuita para probar la funcionalidad.
- Learning Resources
- Documentation
- Source Code
- API References
- Product Support
- Free Support
- Paid Support
- Blog
- Why Aspose.PDF Cloud for Java?
- Customers List
- Security