Extrair Texto de PDF no Node.js SDK
Extrair Texto de Documento PDF usando Cloud Node.js SDK.
Get StartedComo Extrair Texto de PDF via Node.js SDK
Para extrair Texto de PDF, usaremos Aspose.PDF Cloud Node.js SDK. Este SDK Cloud auxilia programadores Node.js no desenvolvimento de aplicativos de criação, anotação, edição e conversão de PDFs baseados em nuvem usando a linguagem de programação Node.js via Aspose.PDF REST API. Simplesmente crie uma conta em Aspose for Cloud e obtenha as informações do seu aplicativo. Uma vez que você tenha o App SID & key, você está pronto para usar o Aspose.PDF Cloud Node.js SDK.
Comando do Console do Gerenciador de Pacotes
npm install asposepdfcloud --save
Passos para extrair Texto usando Node.js
Os desenvolvedores da Aspose.PDF Cloud podem facilmente carregar e extrair Texto de PDF em apenas algumas linhas de código.
- Carregue seu Segredo e Chave do Aplicativo a partir do arquivo JSON ou configure as credenciais de outra forma
- Crie um objeto para conectar-se à API Cloud
- Carregue seu arquivo de documento
- Realize a extração do texto usando a função pdfApi.getText
- Baixe o resultado se necessário
Extrair Texto de PDF usando Node.js
async function () {
const pdfApi = new PdfApi(credentials.id, credentials.key);
try {
const fileBuffer = await fs.readFile(LOCAL_FILE_NAME);
await pdfApi.uploadFile(STORAGE_FILENAME, fileBuffer);
const result = await pdfApi.getText(STORAGE_FILENAME, 0, 0, 0, 0);
const lines = result.body.textOccurrences.list.map(line=>line.text).join("\n");
await fs.writeFile("extracted.txt", lines);
}
catch (error) {
console.error(error.message);
}
}
Trabalhar com Texto em PDF
A extração de texto permite que os dados dentro de PDFs sejam analisados, organizados ou processados em aplicativos externos. O texto extraído pode ser indexado, tornando-o pesquisável em bancos de dados ou sistemas de gerenciamento de conteúdo. Isso melhora a recuperação de documentos e permite um acesso mais rápido a informações específicas, especialmente em grandes arquivos de documentos. Ao extrair texto e salvá-lo em um formato mais simples (como texto simples ou XML), os usuários podem reduzir os tamanhos dos arquivos, facilitando seu compartilhamento ou distribuição. Extraia Texto de documentos PDF com Aspose.PDF Cloud Node.js SDK.
Com nossa biblioteca Node.js você pode:
- Adicionar cabeçalho e rodapé no documento PDF em formato de texto ou imagem.
- Adicionar tabelas e carimbos (texto ou imagem) em documentos PDF.
- Anexar vários documentos PDF a um arquivo existente.
- Trabalhar com anexos, anotações e campos de formulário em PDFs.
- Aplicar criptografia ou descriptografia em documentos PDF e definir uma senha.
- Excluir todos os carimbos e tabelas de uma página ou de todo o documento PDF.
- Excluir um carimbo ou tabela específico do documento PDF pelo seu ID.
- Substituir uma ou várias instâncias de texto em uma página PDF ou em todo o documento.
- Suporte extensivo para converter documentos PDF para vários outros formatos de arquivo.
- Extrair vários elementos de arquivos PDF e otimizar documentos PDF.
- Você pode experimentar nosso App gratuito para extrair texto de arquivos PDF online e testar a funcionalidade.
- Recursos de Aprendizagem
- Documentação
- Código Fonte
- Referências de API
- Suporte ao Produto
- Suporte Gratuito
- Suporte Pago
- Blog
- Por que Aspose.PDF Cloud para Node.js?
- Lista de Clientes
- Segurança