HTML JPG PDF XML DOCX
  Product Family
PDF

Анализ PDF для извлечения текста в Go SDK

API для анализа PDF-документов и извлечения текста с использованием серверного API на Go.

Get Started

Как анализировать PDF-документы для извлечения текста с использованием Cloud Go SDK

Для анализа PDF-документов и извлечения текста через Cloud Go SDK мы будем использовать Aspose.PDF Cloud Go SDK Этот Cloud Go SDK помогает программистам на Go разрабатывать облачные приложения для создания, аннотирования, редактирования, конвертации и анализа PDF с использованием Aspose.PDF REST API. Используйте следующую команду в консоли диспетчера пакетов.

Команда консоли диспетчера пакетов


     
    go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
     
     

Шаги для анализа PDF и извлечения текста с использованием Go SDK

Разработчики Aspose.PDF Cloud могут легко анализировать PDF-документы для извлечения текста. Разработчикам нужно всего несколько строк кода.

  1. Создайте новый объект Configuration с вашим секретом и ключом приложения
  2. Создайте объект для подключения к облачному API
  3. Загрузите файл вашего документа
  4. Анализируйте PDF-документы для извлечения текста в облачном хранилище с помощью функции GetDocumentTextBoxFields
  5. Проверьте ответ и зарегистрируйте результат
  6. Скачайте информацию о текстовых полях в формате JSON на локальный диск, если необходимо
 

Этот пример кода показывает анализ PDF-документа для извлечения текста


package main

import (
	"encoding/json"
	"fmt"
	"os"
	"path"

	asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)

// Extract text boxes form the document
func ParseExtractTextBoxes(documentName string, localFolder string, remoteFolder string) {
	// Get your AppSecret and Key from https://dashboard.aspose.cloud (free registration required).
	pdf_api := asposepdfcloud.NewPdfApiService(APP_SID, APP_KEY, "")

	args := map[string]interface{}{
		"folder": remoteFolder,
	}

	file, _ := os.Open(path.Join(localFolder, documentName))	
	_, _, _ = pdf_api.UploadFile(path.Join(remoteFolder, documentName), file, args)

	result, httpResponse, err := pdf_api.GetDocumentTextBoxFields(documentName, args)
	if err != nil {
		fmt.Println(err.Error())
	} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
		fmt.Println("ParseExtractTextBoxes(): Failed to extract text boxes from the document.")
	} else {
		if result.Fields == nil || len(result.Fields.List) == 0 {
			fmt.Println("ParseExtractTextBoxes(): Text boxes not found in the document.")
		} else {
			resultJson := "[\n"
			for _, textBox := range result.Fields.List {
				fmt.Println("TextBox", textBox)
				jsTable, _ := json.Marshal(textBox)
				resultJson += string(jsTable) + ",\n\n"
			}
			resultJson += "]"
			fileName := path.Join(localFolder, ("parsed_taext_boxes_output_go.json"))
			f, _ := os.Create(fileName)
			_, _ = f.Write([]byte(resultJson))
			fmt.Println("File '" + fileName + "' successfully downloaded.")
		}
	}
}
 

Работа с анализом текста в PDF через Go SDK

Анализируя PDF-документы для извлечения текста, вы можете изменять содержимое полей TextBox по мере необходимости. Это сохраняет положение текста в документах, экономя время и снижая ручную работу. Анализируйте PDF-документы для извлечения текста с помощью Aspose.PDF Cloud Go SDK.

С нашим Go SDK вы можете

  • Добавлять заголовок и нижний колонтитул PDF-документа в текстовом или графическом формате.
  • Добавлять таблицы и текстовые или графические штампы в PDF-документы.
  • Добавлять несколько PDF-документов к существующему файлу.
  • Работать с вложениями PDF, аннотациями и полями форм.
  • Применять шифрование или дешифрование к PDF-документам и устанавливать пароль.
  • Удалять все штампы и таблицы со страницы или всего PDF-документа.
  • Удалять определенный штамп или таблицу из PDF-документа по его ID.
  • Заменять одно или несколько вхождений текста на странице PDF или во всем документе.
  • Поддержка конвертации PDF-документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF-файлов и оптимизировать документы PDF.
  • Вы можете попробовать наше бесплатное приложение для тестирования функциональности.

  •