HTML JPG PDF XML DOCX
  Product Family
PDF

Extraer texto de PDF en Node.js SDK

Extraer texto de documento PDF usando Cloud Node.js SDK.

Get Started

Cómo extraer texto de PDF a través de Node.js SDK

Para extraer texto de PDF, usaremos Aspose.PDF Cloud Node.js SDK. Este SDK en la nube ayuda a los programadores de Node.js a desarrollar aplicaciones en la nube para crear, anotar, editar y convertir PDFs usando el lenguaje de programación Node.js a través de Aspose.PDF REST API. Simplemente cree una cuenta en Aspose for Cloud y obtenga la información de su aplicación. Una vez que tenga el App SID y la clave, estará listo para utilizar el Aspose.PDF Cloud Node.js SDK.

Comando de Consola del Administrador de Paquetes


     
    npm install asposepdfcloud --save
     
     

Pasos para extraer texto usando Node.js

Los desarrolladores de Aspose.PDF Cloud pueden cargar y extraer texto de PDF fácilmente en solo unas pocas líneas de código.

  1. Cargue su Secreto de Aplicación y Clave desde el archivo JSON o configure las credenciales de otra manera
  2. Cree un objeto para conectarse a la API en la nube
  3. Cargue su archivo de documento
  4. Realice la extracción del texto usando la función pdfApi.getText
  5. Descargue el resultado si es necesario
 

Extraer texto de PDF usando Node.js


    async function () {
        const pdfApi = new PdfApi(credentials.id, credentials.key);
        try {
            const fileBuffer = await fs.readFile(LOCAL_FILE_NAME);
            await pdfApi.uploadFile(STORAGE_FILENAME, fileBuffer);
            const result = await pdfApi.getText(STORAGE_FILENAME, 0, 0, 0, 0);
            const lines = result.body.textOccurrences.list.map(line=>line.text).join("\n");
            await fs.writeFile("extracted.txt", lines);
        }
        catch (error) {
            console.error(error.message);
        }
    }
 

Trabajar con texto en PDF

Extraer texto permite que los datos dentro de los PDFs sean analizados, organizados o procesados en aplicaciones externas. El texto extraído puede ser indexado, haciéndolo buscable a través de bases de datos o sistemas de gestión de contenido. Esto mejora la recuperación de documentos y permite un acceso más rápido a información específica, especialmente en grandes archivos de documentos. Al extraer texto y guardarlo en un formato más simple (como texto plano o XML), los usuarios pueden reducir el tamaño de los archivos, haciéndolos más fáciles de compartir o distribuir. Extraiga texto de documentos PDF con Aspose.PDF Cloud Node.js SDK.

Con nuestra biblioteca de Node.js, puede:

  • Agregar encabezados y pies de página de documentos PDF en formato de texto o imagen.
  • Agregar tablas y sellos (texto o imagen) a documentos PDF.
  • Adjuntar múltiples documentos PDF a un archivo existente.
  • Trabajar con archivos adjuntos PDF, anotaciones y campos de formulario.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específico del documento PDF por su ID.
  • Reemplazar una o varias instancias de texto en una página PDF o en todo el documento.
  • Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar los documentos PDF.
  • Puede probar nuestra aplicación gratuita para extraer texto de archivos PDF en línea y probar la funcionalidad.