HTML JPG PDF XML DOCX
  Product Family
PDF

Analisar PDF para extração de Textos no Node.js SDK

API para analisar documentos PDF para extrair textos usando API Node.js do lado do servidor.

Get Started

Como analisar documentos PDF para extração de Textos usando Cloud Node.js SDK

Para analisar documentos PDF para extração de Textos via Cloud Node.js SDK, usaremos Aspose.PDF Cloud Node.js SDK Este Cloud SDK auxilia programadores Node.js no desenvolvimento de aplicativos baseados em nuvem para criação, anotação, edição, conversão e análise de PDFs usando a linguagem de programação Node.js via Aspose.PDF REST API. Simplesmente crie uma conta no Aspose for Cloud e obtenha suas informações de aplicativo. Uma vez que você tenha o App SID e a chave, você está pronto para usar o Aspose.PDF Cloud Node.js SDK.

Comando do Console do Gerenciador de Pacotes


     
    npm install asposepdfcloud --save
     
     

Passos para analisar PDF para extração de Textos usando Node.js SDK

Desenvolvedores do Aspose.PDF Cloud podem facilmente analisar documentos PDF para extração de Textos. Os desenvolvedores precisam de apenas algumas linhas de código.

  1. Crie um novo objeto de Configuração com seu Segredo e Chave de Aplicação
  2. Crie um objeto para conectar-se à API Cloud
  3. Carregue seu arquivo de documento
  4. Analise documentos PDF para extração de Textos no armazenamento em nuvem usando a função getDocumentTextBoxFields
  5. Verifique a resposta e registre o resultado
  6. Baixe informações da caixa de texto em arquivo JSON localmente, se necessário
 

Este código de exemplo mostra a análise de documento PDF para extração de Textos


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTextBoxes};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTextBoxes = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getDocumentTextBoxFields( documentName, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportTextBoxes(): TextBox Fileds successfully extracted!");
                
                var result = "[\n";
                await Promise.all(
                    response.body.fields.list.map(async (textbox) => {
                        const responseText = await pdfApi.getTextBoxField(documentName, textbox.fullName, null, remoteFolder)
                            .then(function(responseTextBox){
                                result += JSON.stringify(textbox) + ",\n\n";
                            });
                        })
                    );
                result += "]";

                const filePath = path.join(localFolder, "parsed_text_boxes_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTextBoxes(): Unexpected error!") 

        }
    }
};
 

Trabalhar com a análise de Texto em PDF via Node.js SDK

Ao analisar documentos PDF para extração de textos, você pode modificar o conteúdo dos campos TextBox conforme necessário. Isso mantém a posição do texto nos documentos enquanto economiza tempo e reduz o trabalho manual. Analise documentos PDF para extração de textos com Aspose.PDF Cloud Node.js SDK.

Com nosso SDK para Node.js você pode

  • Adicionar cabeçalho e rodapé ao documento PDF em formato de texto ou imagem.
  • Adicionar tabelas e carimbos de texto ou imagem a documentos PDF.
  • Anexar múltiplos documentos PDF a um arquivo existente.
  • Trabalhar com anexos, anotações e campos de formulário em PDF.
  • Aplicar criptografia ou descriptografia a documentos PDF e definir uma senha.
  • Excluir todos os carimbos e tabelas de uma página ou de todo o documento PDF.
  • Excluir um carimbo ou tabela específico do documento PDF pelo seu ID.
  • Substituir instâncias únicas ou múltiplas de texto em uma página PDF ou em todo o documento.
  • Suporte extensivo para converter documentos PDF para vários outros formatos de arquivo.
  • Extrair vários elementos de arquivos PDF e otimizar documentos PDF.
  • Você pode experimentar nosso App gratuito para testar a funcionalidade.

  •