Extraer texto de PDF en Node.js SDK
Extraer texto de documento PDF usando Cloud Node.js SDK.
Get StartedCómo extraer texto de PDF a través de Node.js SDK
Para extraer texto de PDF, usaremos Aspose.PDF Cloud Node.js SDK. Este SDK en la nube ayuda a los programadores de Node.js a desarrollar aplicaciones en la nube para crear, anotar, editar y convertir PDFs usando el lenguaje de programación Node.js a través de Aspose.PDF REST API. Simplemente cree una cuenta en Aspose for Cloud y obtenga la información de su aplicación. Una vez que tenga el App SID y la clave, estará listo para utilizar el Aspose.PDF Cloud Node.js SDK.
Comando de Consola del Administrador de Paquetes
npm install asposepdfcloud --save
Pasos para extraer texto usando Node.js
Los desarrolladores de Aspose.PDF Cloud pueden cargar y extraer texto de PDF fácilmente en solo unas pocas líneas de código.
- Cargue su Secreto de Aplicación y Clave desde el archivo JSON o configure las credenciales de otra manera
- Cree un objeto para conectarse a la API en la nube
- Cargue su archivo de documento
- Realice la extracción del texto usando la función pdfApi.getText
- Descargue el resultado si es necesario
Extraer texto de PDF usando Node.js
async function () {
const pdfApi = new PdfApi(credentials.id, credentials.key);
try {
const fileBuffer = await fs.readFile(LOCAL_FILE_NAME);
await pdfApi.uploadFile(STORAGE_FILENAME, fileBuffer);
const result = await pdfApi.getText(STORAGE_FILENAME, 0, 0, 0, 0);
const lines = result.body.textOccurrences.list.map(line=>line.text).join("\n");
await fs.writeFile("extracted.txt", lines);
}
catch (error) {
console.error(error.message);
}
}
Trabajar con texto en PDF
Extraer texto permite que los datos dentro de los PDFs sean analizados, organizados o procesados en aplicaciones externas. El texto extraído puede ser indexado, haciéndolo buscable a través de bases de datos o sistemas de gestión de contenido. Esto mejora la recuperación de documentos y permite un acceso más rápido a información específica, especialmente en grandes archivos de documentos. Al extraer texto y guardarlo en un formato más simple (como texto plano o XML), los usuarios pueden reducir el tamaño de los archivos, haciéndolos más fáciles de compartir o distribuir. Extraiga texto de documentos PDF con Aspose.PDF Cloud Node.js SDK.
Con nuestra biblioteca de Node.js, puede:
- Agregar encabezados y pies de página de documentos PDF en formato de texto o imagen.
- Agregar tablas y sellos (texto o imagen) a documentos PDF.
- Adjuntar múltiples documentos PDF a un archivo existente.
- Trabajar con archivos adjuntos PDF, anotaciones y campos de formulario.
- Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
- Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
- Eliminar un sello o tabla específico del documento PDF por su ID.
- Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
- Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
- Extraer varios elementos de archivos PDF y optimizar los documentos PDF.
- Puede probar nuestra aplicación gratuita para extraer texto de archivos PDF en línea y probar la funcionalidad.
- Recursos de Aprendizaje
- Documentación
- Código Fuente
- Referencias API
- Soporte del Producto
- Soporte Gratuito
- Soporte de Pago
- Blog
- ¿Por qué Aspose.PDF Cloud para Node.js?
- Lista de Clientes
- Seguridad