Analizar PDF para extraer textos en Node.js SDK
API para analizar documentos PDF para extraer textos usando API de Node.js del lado del servidor.
Get StartedCómo analizar documentos PDF para extraer textos usando Cloud Node.js SDK
Para analizar documentos PDF para extraer textos a través de Cloud Node.js SDK, usaremos Aspose.PDF Cloud Node.js SDK Este Cloud SDK ayuda a los programadores de Node.js a desarrollar aplicaciones en la nube para crear, anotar, editar, convertir y analizar PDF usando el lenguaje de programación Node.js a través de Aspose.PDF REST API. Simplemente crea una cuenta en Aspose for Cloud y obtén la información de tu aplicación. Una vez que tengas el App SID y la clave, estás listo para usar el Aspose.PDF Cloud Node.js SDK.
Comando de la Consola del Administrador de Paquetes
npm install asposepdfcloud --save
Pasos para analizar PDF para extraer textos usando Node.js SDK
Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer textos. Los desarrolladores solo necesitan unas pocas líneas de código.
- Crear un nuevo objeto de Configuración con tu Secreto de Aplicación y Clave
- Crear un objeto para conectarse a la API en la nube
- Subir tu archivo de documento
- Analizar documentos PDF para extraer textos en el almacenamiento en la nube usando la función getDocumentTextBoxFields
- Verificar la respuesta y registrar el resultado
- Descargar la información de los cuadros de texto en un archivo JSON localmente si es necesario
Este código de ejemplo muestra cómo analizar un documento PDF para extraer textos
import fs from 'node:fs/promises';
import path from 'node:path';
export {ParseExportTextBoxes};
const pdfApi = new PdfApi(APP_SID, APP_KEY);
const ParseExportTextBoxes = {
async uploadDocument (documentName, localFolder, tempFolder) {
const fileNamePath = path.join(localFolder, documentName);
const fileData = await fs.readFile(fileNamePath);
const storagePath = path.join(tempFolder, documentName);
await pdfApi.uploadFile(storagePath, fileData)
.then(() => console.log("File: '" + documentName +"' successfully uploaded."));
},
async export(documentName, localFolder, remoteFolder) {
if ( pdfApi ) {
await uploadDocument(documentName, localFolder, remoteFolder);
const response = await pdfApi.getDocumentTextBoxFields( documentName, null, remoteFolder );
if (response.body.code == 200) {
console.log("ParseExportTextBoxes(): TextBox Fileds successfully extracted!");
var result = "[\n";
await Promise.all(
response.body.fields.list.map(async (textbox) => {
const responseText = await pdfApi.getTextBoxField(documentName, textbox.fullName, null, remoteFolder)
.then(function(responseTextBox){
result += JSON.stringify(textbox) + ",\n\n";
});
})
);
result += "]";
const filePath = path.join(localFolder, "parsed_text_boxes_output.json");
await fs.writeFile(filePath, result);
console.log("Downloaded: " + filePath);
}
else
console.error("ParseExportTextBoxes(): Unexpected error!")
}
}
};
Trabajar con el análisis de texto en PDF a través de Node.js SDK
Al analizar documentos PDF para la extracción de textos, puedes modificar el contenido de los campos de TextBox según sea necesario. Esto mantiene la posición del texto en los documentos mientras ahorra tiempo y reduce el trabajo manual. Analiza documentos PDF para extraer textos con Aspose.PDF Cloud Node.js SDK.
Con nuestro SDK para Node.js puedes
- Añadir encabezado y pie de página del documento PDF en formato de texto o imagen.
- Añadir tablas y sellos de texto o imagen a documentos PDF.
- Anexar múltiples documentos PDF a un archivo existente.
- Trabajar con archivos adjuntos, anotaciones y campos de formulario PDF.
- Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
- Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
- Eliminar un sello o tabla específico del documento PDF por su ID.
- Reemplazar instancias únicas o múltiples de texto en una página PDF o de todo el documento.
- Soporte extenso para convertir documentos PDF a varios otros formatos de archivo.
- Extraer varios elementos de archivos PDF y optimizar documentos PDF.
- Puedes probar nuestra App gratuita para probar la funcionalidad.
- Recursos de Aprendizaje
- Documentación
- Código Fuente
- Referencias de API
- Soporte del Producto
- Soporte Gratuito
- Soporte de Pago
- Blog
- ¿Por qué Aspose.PDF Cloud para Node.js?
- Lista de Clientes
- Seguridad