Analisar PDF para extração de Texto por nome no SDK Java
API para analisar documentos PDF e extrair texto por nome usando API Java do lado do servidor.
Get StartedComo analisar documentos PDF para extração de Texto por nome usando Cloud Java SDK
Para analisar documentos PDF e extrair Texto por nome via Cloud Java SDK, usaremos Aspose.PDF Cloud Java SDK Este Cloud Java SDK permite que você crie facilmente aplicativos de criação, edição e conversão de PDF baseados em nuvem em linguagem Java para várias plataformas de nuvem. Abrir Repository gerenciador de pacotes, procure por Aspose.PDF Cloud e instale. Você também pode usar o seguinte comando no Console do Gerenciador de Pacotes para instalá-lo usando Maven.
Adicione o repositório Aspose Cloud ao seu arquivo pom.xml da aplicação
Adicionar repositório Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Para instalar a biblioteca cliente da API em seu repositório Maven local, basta executar:
Instalação a partir do Github
mvn clean install
Para implantá-lo em um repositório Maven remoto, configure as definições do repositório e execute:
Implantar repositório Maven
mvn clean deploy
Etapas para analisar PDF e extrair Texto por nome usando Java SDK
Desenvolvedores Aspose.PDF Cloud podem facilmente analisar documentos PDF para extração de Texto por nome. Os desenvolvedores precisam de apenas algumas linhas de código.
- Crie um novo objeto Configuration com seu Segredo e Chave da Aplicação
- Crie um objeto para conectar à API da Nuvem
- Faça upload do seu arquivo de documento
- Analise documentos PDF para extração de Texto por nome no armazenamento em nuvem usando a função etTextBoxField
- Verifique a resposta e registre o resultado
- Se a operação foi bem-sucedida, imprima o texto extraído
Este código de exemplo demonstra a análise de documento PDF para extração de Texto por nome
import java.io.File;
import java.nio.file.Files;
import java.nio.file.OpenOption;
import java.nio.file.Path;
import java.nio.file.StandardOpenOption;
import com.google.gson.Gson;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TextBoxField;
import com.aspose.asposecloudpdf.model.TextBoxFieldResponse;
public class ParseGetTextBoxByName {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String OUTPUT_FILE = "parsed_text_box_field_output.json";
String TEXT_BOX_NAME = "_YOUR_FILED_NAME_";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// perform action
TextBoxFieldResponse response = pdfApi.getTextBoxField(PDF_DOCUMENT, TEXT_BOX_NAME, null, REMOTE_FOLDER);
System.out.println("TextBox fields extracted status: " + response.getStatus());
TextBoxField fieldDef = response.getField();
String jsonFiled = new Gson().toJson(fieldDef);
// save json
Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
byte[] strToBytes = jsonFiled.getBytes();
Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
System.out.println("TextBox field successfully extracted to: '" + path + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
Trabalhe com a análise de Texto em PDF via Java SDK
Ao analisar documentos PDF para extração de texto por nome, você pode modificar o conteúdo do campo TextBox conforme necessário. Isso mantém a posição do texto nos documentos, economizando tempo e reduzindo o trabalho manual. Analise documentos PDF para extração de texto por nome com Aspose.PDF Cloud Java SDK.
Com nosso Java SDK você pode
- Adicionar cabeçalho e rodapé em documentos PDF em formato de texto ou imagem.
- Adicionar tabelas e carimbos de texto ou imagem a documentos PDF.
- Anexar múltiplos documentos PDF a um arquivo existente.
- Trabalhar com anexos PDF, anotações e campos de formulário.
- Aplicar criptografia ou descriptografia a documentos PDF e definir uma senha.
- Excluir todos os selos e tabelas de uma página ou de todo o documento PDF.
- Excluir um selo ou tabela específico do documento PDF pelo seu ID.
- Substituir uma ou várias ocorrências de texto em uma página PDF ou em todo o documento.
- Suporte abrangente para converter documentos PDF em vários outros formatos de arquivo.
- Extrair diversos elementos de arquivos PDF e otimizar documentos PDF.
- Você pode experimentar nosso Aplicativo gratuito para testar a funcionalidade.
- Learning Resources
- Documentation
- Source Code
- API References
- Product Support
- Free Support
- Paid Support
- Blog
- Why Aspose.PDF Cloud for Java?
- Customers List
- Security