HTML JPG PDF XML DOCX
  Product Family
PDF

Extrair Texto de PDF no Node.js SDK

Extrair Texto de Documento PDF usando Cloud Node.js SDK.

Get Started

Como Extrair Texto de PDF via Node.js SDK

Para extrair Texto de PDF, usaremos Aspose.PDF Cloud Node.js SDK. Este SDK Cloud auxilia programadores Node.js no desenvolvimento de aplicativos de criação, anotação, edição e conversão de PDFs baseados em nuvem usando a linguagem de programação Node.js via Aspose.PDF REST API. Simplesmente crie uma conta em Aspose for Cloud e obtenha as informações do seu aplicativo. Uma vez que você tenha o App SID & key, você está pronto para usar o Aspose.PDF Cloud Node.js SDK.

Comando do Console do Gerenciador de Pacotes


     
    npm install asposepdfcloud --save
     
     

Passos para extrair Texto usando Node.js

Os desenvolvedores da Aspose.PDF Cloud podem facilmente carregar e extrair Texto de PDF em apenas algumas linhas de código.

  1. Carregue seu Segredo e Chave do Aplicativo a partir do arquivo JSON ou configure as credenciais de outra forma
  2. Crie um objeto para conectar-se à API Cloud
  3. Carregue seu arquivo de documento
  4. Realize a extração do texto usando a função pdfApi.getText
  5. Baixe o resultado se necessário
 

Extrair Texto de PDF usando Node.js


    async function () {
        const pdfApi = new PdfApi(credentials.id, credentials.key);
        try {
            const fileBuffer = await fs.readFile(LOCAL_FILE_NAME);
            await pdfApi.uploadFile(STORAGE_FILENAME, fileBuffer);
            const result = await pdfApi.getText(STORAGE_FILENAME, 0, 0, 0, 0);
            const lines = result.body.textOccurrences.list.map(line=>line.text).join("\n");
            await fs.writeFile("extracted.txt", lines);
        }
        catch (error) {
            console.error(error.message);
        }
    }
 

Trabalhar com Texto em PDF

A extração de texto permite que os dados dentro de PDFs sejam analisados, organizados ou processados em aplicativos externos. O texto extraído pode ser indexado, tornando-o pesquisável em bancos de dados ou sistemas de gerenciamento de conteúdo. Isso melhora a recuperação de documentos e permite um acesso mais rápido a informações específicas, especialmente em grandes arquivos de documentos. Ao extrair texto e salvá-lo em um formato mais simples (como texto simples ou XML), os usuários podem reduzir os tamanhos dos arquivos, facilitando seu compartilhamento ou distribuição. Extraia Texto de documentos PDF com Aspose.PDF Cloud Node.js SDK.

Com nossa biblioteca Node.js você pode:

  • Adicionar cabeçalho e rodapé no documento PDF em formato de texto ou imagem.
  • Adicionar tabelas e carimbos (texto ou imagem) em documentos PDF.
  • Anexar vários documentos PDF a um arquivo existente.
  • Trabalhar com anexos, anotações e campos de formulário em PDFs.
  • Aplicar criptografia ou descriptografia em documentos PDF e definir uma senha.
  • Excluir todos os carimbos e tabelas de uma página ou de todo o documento PDF.
  • Excluir um carimbo ou tabela específico do documento PDF pelo seu ID.
  • Substituir uma ou várias instâncias de texto em uma página PDF ou em todo o documento.
  • Suporte extensivo para converter documentos PDF para vários outros formatos de arquivo.
  • Extrair vários elementos de arquivos PDF e otimizar documentos PDF.
  • Você pode experimentar nosso App gratuito para extrair texto de arquivos PDF online e testar a funcionalidade.