HTML JPG PDF XML DOCX
  Product Family
PDF

Analisar PDF para extração de Texto por nome no SDK Java

API para analisar documentos PDF e extrair texto por nome usando API Java do lado do servidor.

Get Started

Como analisar documentos PDF para extração de Texto por nome usando Cloud Java SDK

Para analisar documentos PDF e extrair Texto por nome via Cloud Java SDK, usaremos Aspose.PDF Cloud Java SDK Este Cloud Java SDK permite que você crie facilmente aplicativos de criação, edição e conversão de PDF baseados em nuvem em linguagem Java para várias plataformas de nuvem. Abrir Repository gerenciador de pacotes, procure por Aspose.PDF Cloud e instale. Você também pode usar o seguinte comando no Console do Gerenciador de Pacotes para instalá-lo usando Maven.

Adicione o repositório Aspose Cloud ao seu arquivo pom.xml da aplicação

Adicionar repositório Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Para instalar a biblioteca cliente da API em seu repositório Maven local, basta executar:

Instalação a partir do Github


    mvn clean install

Para implantá-lo em um repositório Maven remoto, configure as definições do repositório e execute:

Implantar repositório Maven


    mvn clean deploy

Etapas para analisar PDF e extrair Texto por nome usando Java SDK

Desenvolvedores Aspose.PDF Cloud podem facilmente analisar documentos PDF para extração de Texto por nome. Os desenvolvedores precisam de apenas algumas linhas de código.

  1. Crie um novo objeto Configuration com seu Segredo e Chave da Aplicação
  2. Crie um objeto para conectar à API da Nuvem
  3. Faça upload do seu arquivo de documento
  4. Analise documentos PDF para extração de Texto por nome no armazenamento em nuvem usando a função etTextBoxField
  5. Verifique a resposta e registre o resultado
  6. Se a operação foi bem-sucedida, imprima o texto extraído
 

Este código de exemplo demonstra a análise de documento PDF para extração de Texto por nome


    import java.io.File;
    import java.nio.file.Files;
    import java.nio.file.OpenOption;
    import java.nio.file.Path;
    import java.nio.file.StandardOpenOption;
    import com.google.gson.Gson;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TextBoxField;
    import com.aspose.asposecloudpdf.model.TextBoxFieldResponse;
    	

    public class ParseGetTextBoxByName {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String OUTPUT_FILE     = "parsed_text_box_field_output.json";
            String TEXT_BOX_NAME   = "_YOUR_FILED_NAME_";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // perform action
                TextBoxFieldResponse response = pdfApi.getTextBoxField(PDF_DOCUMENT, TEXT_BOX_NAME, null, REMOTE_FOLDER);
                System.out.println("TextBox fields extracted status: " + response.getStatus());

                TextBoxField fieldDef = response.getField();
                String jsonFiled = new Gson().toJson(fieldDef);

                // save json
                Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
                byte[] strToBytes = jsonFiled.getBytes();
                Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
		
                System.out.println("TextBox field successfully extracted to: '" + path + "'");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }    
 

Trabalhe com a análise de Texto em PDF via Java SDK

Ao analisar documentos PDF para extração de texto por nome, você pode modificar o conteúdo do campo TextBox conforme necessário. Isso mantém a posição do texto nos documentos, economizando tempo e reduzindo o trabalho manual. Analise documentos PDF para extração de texto por nome com Aspose.PDF Cloud Java SDK.

Com nosso Java SDK você pode

  • Adicionar cabeçalho e rodapé em documentos PDF em formato de texto ou imagem.
  • Adicionar tabelas e carimbos de texto ou imagem a documentos PDF.
  • Anexar múltiplos documentos PDF a um arquivo existente.
  • Trabalhar com anexos PDF, anotações e campos de formulário.
  • Aplicar criptografia ou descriptografia a documentos PDF e definir uma senha.
  • Excluir todos os selos e tabelas de uma página ou de todo o documento PDF.
  • Excluir um selo ou tabela específico do documento PDF pelo seu ID.
  • Substituir uma ou várias ocorrências de texto em uma página PDF ou em todo o documento.
  • Suporte abrangente para converter documentos PDF em vários outros formatos de arquivo.
  • Extrair diversos elementos de arquivos PDF e otimizar documentos PDF.
  • Você pode experimentar nosso Aplicativo gratuito para testar a funcionalidade.

  •