Analisar PDF para extração de tabelas no SDK Java
API para analisar documentos PDF e extrair tabelas usando API Java no servidor.
Get StartedComo analisar documentos PDF para extração de tabelas usando Cloud Java SDK
Para analisar documentos PDF e extrair tabelas via Cloud Java SDK, usaremos Aspose.PDF Cloud Java SDK Este SDK Java em nuvem permite que você crie facilmente aplicativos de criação, edição e conversão de PDF baseados em nuvem na linguagem Java para várias plataformas de nuvem. Abrir Repository gerenciador de pacotes, procure por Aspose.PDF Cloud e instale. Você também pode usar o seguinte comando no Console do Gerenciador de Pacotes para instalá-lo usando Maven.
Adicione o repositório Aspose Cloud ao seu pom.xml da aplicação
Adicionar repositório Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Para instalar a biblioteca cliente da API no seu repositório Maven local, basta executar:
Instalação a partir do Github
mvn clean install
Para implantá-lo em um repositório Maven remoto, configure as definições do repositório e execute:
Implantar repositório Maven
mvn clean deploy
Etapas para analisar PDF para extração de tabelas usando SDK Java
Desenvolvedores Aspose.PDF Cloud podem analisar facilmente documentos PDF para extração de tabelas. Os desenvolvedores precisam de apenas algumas linhas de código.
- Crie um novo objeto Configuration com seu Secret e Key da aplicação
- Crie um objeto para conectar à API da nuvem
- Carregue o arquivo do seu documento
- Analise documentos PDF para extração de tabelas no armazenamento em nuvem usando a função getDocumentTables
- Verifique a resposta e registre o resultado
- Se a operação foi bem-sucedida, imprima as tabelas extraídas
Este código de exemplo mostra a análise de documento PDF para extração de tabelas
import java.io.File;
import java.nio.file.Files;
import java.nio.file.OpenOption;
import java.nio.file.StandardOpenOption;
import java.nio.file.Path;
import com.google.gson.Gson;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TableRecognized;
import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;
public class ParseGetTables {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String OUTPUT_FILE = "parsed_tables_output.json";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// perform action
TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null, REMOTE_FOLDER);
System.out.println("Tables extracted status: " + response.getStatus());
String jsonResult = "[\n";
for (TableRecognized tableDef : response.getTables().getList()) {
String jsonTable = new Gson().toJson(tableDef);
jsonResult += jsonTable + ",\n\n";
}
jsonResult +="]";
// save json
Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
byte[] strToBytes = jsonResult.getBytes();
Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
System.out.println("Tables successfully extracted to: '" + path + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
Trabalhe com a análise de tabelas em PDF via SDK Java
Ao analisar documentos PDF para extração de tabelas, você pode modificar o conteúdo das tabelas conforme necessário. Isso mantém a posição da tabela nos documentos, economizando tempo e reduzindo o trabalho manual. Analise documentos PDF para extrair tabelas com o Aspose.PDF Cloud Java SDK.
Com nosso SDK Java você pode
- Adicionar cabeçalho e rodapé de documentos PDF em formato de texto ou imagem.
- Inserir tabelas e textos ou carimbos de imagem em documentos PDF.
- Anexar múltiplos documentos PDF a um arquivo existente.
- Trabalhar com anexos PDF, anotações e campos de formulário.
- Aplique criptografia ou descriptografia a documentos PDF e defina uma senha.
- Exclua todos os carimbos e tabelas de uma página ou de todo o documento PDF.
- Exclua um carimbo ou tabela específico do documento PDF pelo seu ID.
- Substitua uma ou várias ocorrências de texto em uma página PDF ou em todo o documento.
- Suporte extensivo para converter documentos PDF em diversos outros formatos de arquivo.
- Extraia vários elementos de arquivos PDF e otimize os documentos PDF.
- Você pode experimentar nosso App gratuito para testar a funcionalidade.
- Recursos de Aprendizagem
- Documentação
- Código Fonte
- Referências da API
- Suporte ao Produto
- Suporte Gratuito
- Suporte Pago
- Blog
- Por que Aspose.PDF Cloud para Java?
- Lista de Clientes
- Segurança