Анализ PDF для извлечения текста в Go SDK
API для анализа PDF-документов и извлечения текста с использованием серверного API на Go.
Get StartedКак анализировать PDF-документы для извлечения текста с использованием Cloud Go SDK
Для анализа PDF-документов и извлечения текста через Cloud Go SDK мы будем использовать Aspose.PDF Cloud Go SDK Этот Cloud Go SDK помогает программистам на Go разрабатывать облачные приложения для создания, аннотирования, редактирования, конвертации и анализа PDF с использованием Aspose.PDF REST API. Используйте следующую команду в консоли диспетчера пакетов.
Команда консоли диспетчера пакетов
go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
Шаги для анализа PDF и извлечения текста с использованием Go SDK
Разработчики Aspose.PDF Cloud могут легко анализировать PDF-документы для извлечения текста. Разработчикам нужно всего несколько строк кода.
- Создайте новый объект Configuration с вашим секретом и ключом приложения
- Создайте объект для подключения к облачному API
- Загрузите файл вашего документа
- Анализируйте PDF-документы для извлечения текста в облачном хранилище с помощью функции GetDocumentTextBoxFields
- Проверьте ответ и зарегистрируйте результат
- Скачайте информацию о текстовых полях в формате JSON на локальный диск, если необходимо
Этот пример кода показывает анализ PDF-документа для извлечения текста
package main
import (
"encoding/json"
"fmt"
"os"
"path"
asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)
// Extract text boxes form the document
func ParseExtractTextBoxes(documentName string, localFolder string, remoteFolder string) {
// Get your AppSecret and Key from https://dashboard.aspose.cloud (free registration required).
pdf_api := asposepdfcloud.NewPdfApiService(APP_SID, APP_KEY, "")
args := map[string]interface{}{
"folder": remoteFolder,
}
file, _ := os.Open(path.Join(localFolder, documentName))
_, _, _ = pdf_api.UploadFile(path.Join(remoteFolder, documentName), file, args)
result, httpResponse, err := pdf_api.GetDocumentTextBoxFields(documentName, args)
if err != nil {
fmt.Println(err.Error())
} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
fmt.Println("ParseExtractTextBoxes(): Failed to extract text boxes from the document.")
} else {
if result.Fields == nil || len(result.Fields.List) == 0 {
fmt.Println("ParseExtractTextBoxes(): Text boxes not found in the document.")
} else {
resultJson := "[\n"
for _, textBox := range result.Fields.List {
fmt.Println("TextBox", textBox)
jsTable, _ := json.Marshal(textBox)
resultJson += string(jsTable) + ",\n\n"
}
resultJson += "]"
fileName := path.Join(localFolder, ("parsed_taext_boxes_output_go.json"))
f, _ := os.Create(fileName)
_, _ = f.Write([]byte(resultJson))
fmt.Println("File '" + fileName + "' successfully downloaded.")
}
}
}
Работа с анализом текста в PDF через Go SDK
Анализируя PDF-документы для извлечения текста, вы можете изменять содержимое полей TextBox по мере необходимости. Это сохраняет положение текста в документах, экономя время и снижая ручную работу. Анализируйте PDF-документы для извлечения текста с помощью Aspose.PDF Cloud Go SDK.
С нашим Go SDK вы можете
- Добавлять заголовок и нижний колонтитул PDF-документа в текстовом или графическом формате.
- Добавлять таблицы и текстовые или графические штампы в PDF-документы.
- Добавлять несколько PDF-документов к существующему файлу.
- Работать с вложениями PDF, аннотациями и полями форм.
- Применять шифрование или дешифрование к PDF-документам и устанавливать пароль.
- Удалять все штампы и таблицы со страницы или всего PDF-документа.
- Удалять определенный штамп или таблицу из PDF-документа по его ID.
- Заменять одно или несколько вхождений текста на странице PDF или во всем документе.
- Поддержка конвертации PDF-документов в различные другие форматы файлов.
- Извлекать различные элементы PDF-файлов и оптимизировать документы PDF.
- Вы можете попробовать наше бесплатное приложение для тестирования функциональности.
- Учебные ресурсы
- Документация
- Исходный код
- Справочник API
- Поддержка продукта
- Бесплатная поддержка
- Платная поддержка
- Блог
- Почему Aspose.PDF Cloud для Go?
- Список клиентов
- Безопасность