HTML JPG PDF XML DOCX
  Product Family
PDF

Analizar PDF para extraer Textos en Go SDK

API para analizar documentos PDF y extraer textos usando API Go del lado del servidor.

Get Started

Cómo analizar documentos PDF para extraer Textos usando Cloud Go SDK

Para analizar documentos PDF para extraer Textos a través de Cloud Go SDK, usaremos Aspose.PDF Cloud Go SDK Este Cloud Go SDK ayuda a los programadores de Go a desarrollar aplicaciones basadas en la nube para crear, anotar, editar, convertir y analizar archivos PDF usando el lenguaje de programación Go a través de Aspose.PDF REST API. Use el siguiente comando desde la Consola del Administrador de Paquetes.

Comando de la Consola del Administrador de Paquetes


     
    go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
     
     

Pasos para analizar PDF para extraer Textos usando Go SDK

Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer Textos. Los desarrolladores necesitan solo unas pocas líneas de código.

  1. Crear un nuevo objeto de Configuración con su Secreto y Clave de Aplicación
  2. Crear un objeto para conectarse a la API en la nube
  3. Cargar su archivo de documento
  4. Analizar documentos PDF para extraer Textos en almacenamiento en la nube usando la función GetDocumentTextBoxFields
  5. Verificar la respuesta y registrar el resultado
  6. Descargar la información de los cuadros de texto como archivo JSON localmente si es necesario
 

Este código de ejemplo muestra el análisis de un documento PDF para extraer Textos


package main

import (
	"encoding/json"
	"fmt"
	"os"
	"path"

	asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)

// Extract text boxes form the document
func ParseExtractTextBoxes(documentName string, localFolder string, remoteFolder string) {
	// Get your AppSecret and Key from https://dashboard.aspose.cloud (free registration required).
	pdf_api := asposepdfcloud.NewPdfApiService(APP_SID, APP_KEY, "")

	args := map[string]interface{}{
		"folder": remoteFolder,
	}

	file, _ := os.Open(path.Join(localFolder, documentName))	
	_, _, _ = pdf_api.UploadFile(path.Join(remoteFolder, documentName), file, args)

	result, httpResponse, err := pdf_api.GetDocumentTextBoxFields(documentName, args)
	if err != nil {
		fmt.Println(err.Error())
	} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
		fmt.Println("ParseExtractTextBoxes(): Failed to extract text boxes from the document.")
	} else {
		if result.Fields == nil || len(result.Fields.List) == 0 {
			fmt.Println("ParseExtractTextBoxes(): Text boxes not found in the document.")
		} else {
			resultJson := "[\n"
			for _, textBox := range result.Fields.List {
				fmt.Println("TextBox", textBox)
				jsTable, _ := json.Marshal(textBox)
				resultJson += string(jsTable) + ",\n\n"
			}
			resultJson += "]"
			fileName := path.Join(localFolder, ("parsed_taext_boxes_output_go.json"))
			f, _ := os.Create(fileName)
			_, _ = f.Write([]byte(resultJson))
			fmt.Println("File '" + fileName + "' successfully downloaded.")
		}
	}
}
 

Trabajar con el análisis de Texto en PDF a través de Go SDK

Al analizar documentos PDF para la extracción de textos, puede modificar el contenido de los campos TextBox según sea necesario. Esto mantiene la posición del texto en los documentos mientras ahorra tiempo y reduce el trabajo manual. Analizar documentos PDF para extraer textos con Aspose.PDF Cloud Go SDK.

Con nuestro Go SDK puede

  • Agregar el encabezado y pie de página del documento PDF en formato de texto o imagen.
  • Agregar tablas y sellos de texto o imagen a los documentos PDF.
  • Anexar múltiples documentos PDF a un archivo existente.
  • Trabajar con archivos adjuntos, anotaciones y campos de formulario de PDF.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específico del documento PDF por su ID.
  • Reemplazar instancias únicas o múltiples de texto en una página PDF o en todo el documento.
  • Amplio soporte para convertir documentos PDF a varios otros formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar documentos PDF.
  • Puede probar nuestra aplicación gratuita para probar la funcionalidad.

  •