HTML JPG PDF XML DOCX
  Product Family
PDF

Analisar PDF para extrair Textos no Go SDK

API para analisar documentos PDF e extrair textos usando API Go no servidor.

Get Started

Como analisar documentos PDF para extrair Textos usando Cloud Go SDK

Para analisar documentos PDF e extrair Textos via Cloud Go SDK, usaremos Aspose.PDF Cloud Go SDK Este Cloud Go SDK ajuda programadores Go a desenvolver aplicativos baseados em nuvem para criar, anotar, editar, converter e analisar PDFs usando a linguagem de programação Go via Aspose.PDF REST API. Use o seguinte comando no Console do Gerenciador de Pacotes.

Comando do Console do Gerenciador de Pacotes


     
    go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
     
     

Etapas para analisar PDF e extrair Textos usando Go SDK

Os desenvolvedores do Aspose.PDF Cloud podem facilmente analisar documentos PDF para extrair Textos. Os desenvolvedores precisam de apenas algumas linhas de código.

  1. Crie um novo objeto de Configuração com seu Segredo e Chave de Aplicação
  2. Crie um objeto para conectar à API da Nuvem
  3. Faça o upload do arquivo do seu documento
  4. Analise documentos PDF para extrair Textos no armazenamento em nuvem usando a função GetDocumentTextBoxFields
  5. Verifique a resposta e registre o resultado
  6. Baixe as informações das caixas de texto como um arquivo JSON localmente, se necessário
 

Este código de exemplo mostra a análise de documentos PDF para extrair Textos


package main

import (
	"encoding/json"
	"fmt"
	"os"
	"path"

	asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)

// Extract text boxes form the document
func ParseExtractTextBoxes(documentName string, localFolder string, remoteFolder string) {
	// Get your AppSecret and Key from https://dashboard.aspose.cloud (free registration required).
	pdf_api := asposepdfcloud.NewPdfApiService(APP_SID, APP_KEY, "")

	args := map[string]interface{}{
		"folder": remoteFolder,
	}

	file, _ := os.Open(path.Join(localFolder, documentName))	
	_, _, _ = pdf_api.UploadFile(path.Join(remoteFolder, documentName), file, args)

	result, httpResponse, err := pdf_api.GetDocumentTextBoxFields(documentName, args)
	if err != nil {
		fmt.Println(err.Error())
	} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
		fmt.Println("ParseExtractTextBoxes(): Failed to extract text boxes from the document.")
	} else {
		if result.Fields == nil || len(result.Fields.List) == 0 {
			fmt.Println("ParseExtractTextBoxes(): Text boxes not found in the document.")
		} else {
			resultJson := "[\n"
			for _, textBox := range result.Fields.List {
				fmt.Println("TextBox", textBox)
				jsTable, _ := json.Marshal(textBox)
				resultJson += string(jsTable) + ",\n\n"
			}
			resultJson += "]"
			fileName := path.Join(localFolder, ("parsed_taext_boxes_output_go.json"))
			f, _ := os.Create(fileName)
			_, _ = f.Write([]byte(resultJson))
			fmt.Println("File '" + fileName + "' successfully downloaded.")
		}
	}
}
 

Trabalhar com a análise de Texto em PDF via Go SDK

Ao analisar documentos PDF para extração de textos, você pode modificar o conteúdo dos campos de Caixa de Texto conforme necessário. Isso mantém a posição do texto nos documentos enquanto economiza tempo e reduz o trabalho manual. Analise documentos PDF para extrair textos com Aspose.PDF Cloud Go SDK.

Com nosso Go SDK você pode

  • Adicionar cabeçalho e rodapé ao documento PDF em formato de texto ou imagem.
  • Adicionar tabelas e carimbos de texto ou imagem aos documentos PDF.
  • Anexar múltiplos documentos PDF a um arquivo existente.
  • Trabalhar com anexos, anotações e campos de formulário de PDF.
  • Aplicar criptografia ou descriptografia a documentos PDF e definir uma senha.
  • Excluir todos os carimbos e tabelas de uma página ou de todo o documento PDF.
  • Excluir um carimbo ou tabela específico do documento PDF pelo seu ID.
  • Substituir uma ou várias instâncias de texto em uma página PDF ou em todo o documento.
  • Suporte extensivo para converter documentos PDF para vários outros formatos de arquivo.
  • Extrair vários elementos de arquivos PDF e otimizar documentos PDF.
  • Você pode experimentar nosso App gratuito para testar a funcionalidade.

  •