Phân tích PDF để trích xuất Văn bản trong Go SDK
API để phân tích tài liệu PDF nhằm trích xuất văn bản bằng cách sử dụng API Go phía máy chủ.
Get StartedCách phân tích tài liệu PDF để trích xuất Văn bản bằng Cloud Go SDK
Để phân tích tài liệu PDF để trích xuất Văn bản qua Cloud Go SDK, chúng tôi sẽ sử dụng Aspose.PDF Cloud Go SDK Cloud Go SDK này hỗ trợ các lập trình viên Go phát triển các ứng dụng tạo, chú thích, chỉnh sửa, chuyển đổi và phân tích PDF dựa trên đám mây bằng ngôn ngữ lập trình Go qua Aspose.PDF REST API. Sử dụng lệnh sau từ Package Manager Console.
Lệnh trong Package Manager Console
go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
Các bước để phân tích PDF để trích xuất Văn bản bằng Go SDK
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất Văn bản. Các nhà phát triển chỉ cần một vài dòng mã.
- Tạo một đối tượng Cấu hình mới với Bí mật và Khóa Ứng dụng của bạn
- Tạo một đối tượng để kết nối với API Đám mây
- Tải lên tệp tài liệu của bạn
- Phân tích các tài liệu PDF để trích xuất Văn bản trong lưu trữ đám mây bằng cách sử dụng hàm GetDocumentTextBoxFields
- Kiểm tra phản hồi và ghi lại kết quả
- Tải xuống thông tin Hộp văn bản dưới dạng tệp JSON cục bộ nếu cần
Đoạn mã mẫu này cho thấy cách phân tích tài liệu PDF để trích xuất Văn bản
package main
import (
"encoding/json"
"fmt"
"os"
"path"
asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)
// Extract text boxes form the document
func ParseExtractTextBoxes(documentName string, localFolder string, remoteFolder string) {
// Get your AppSecret and Key from https://dashboard.aspose.cloud (free registration required).
pdf_api := asposepdfcloud.NewPdfApiService(APP_SID, APP_KEY, "")
args := map[string]interface{}{
"folder": remoteFolder,
}
file, _ := os.Open(path.Join(localFolder, documentName))
_, _, _ = pdf_api.UploadFile(path.Join(remoteFolder, documentName), file, args)
result, httpResponse, err := pdf_api.GetDocumentTextBoxFields(documentName, args)
if err != nil {
fmt.Println(err.Error())
} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
fmt.Println("ParseExtractTextBoxes(): Failed to extract text boxes from the document.")
} else {
if result.Fields == nil || len(result.Fields.List) == 0 {
fmt.Println("ParseExtractTextBoxes(): Text boxes not found in the document.")
} else {
resultJson := "[\n"
for _, textBox := range result.Fields.List {
fmt.Println("TextBox", textBox)
jsTable, _ := json.Marshal(textBox)
resultJson += string(jsTable) + ",\n\n"
}
resultJson += "]"
fileName := path.Join(localFolder, ("parsed_taext_boxes_output_go.json"))
f, _ := os.Create(fileName)
_, _ = f.Write([]byte(resultJson))
fmt.Println("File '" + fileName + "' successfully downloaded.")
}
}
}
Làm việc với việc phân tích Văn bản trong PDF qua Go SDK
Bằng cách phân tích tài liệu PDF để trích xuất văn bản, bạn có thể chỉnh sửa nội dung của các trường TextBox theo nhu cầu. Điều này duy trì vị trí của văn bản trong các tài liệu trong khi tiết kiệm thời gian và giảm bớt công việc thủ công. Phân tích tài liệu PDF để trích xuất văn bản với Aspose.PDF Cloud Go SDK.
Với Go SDK của chúng tôi, bạn có thể
- Thêm tiêu đề & chân trang của tài liệu PDF dưới dạng văn bản hoặc hình ảnh.
- Thêm bảng & con dấu văn bản hoặc hình ảnh vào tài liệu PDF.
- Nối nhiều tài liệu PDF vào một tệp hiện có.
- Làm việc với các tệp đính kèm, chú thích & trường biểu mẫu PDF.
- Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & thiết lập mật khẩu.
- Xóa tất cả các con dấu & bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
- Xóa một con dấu hoặc bảng cụ thể khỏi tài liệu PDF bằng ID của nó.
- Thay thế một hoặc nhiều trường hợp của văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
- Hỗ trợ rộng rãi cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác.
- Trích xuất các phần tử khác nhau của tệp PDF & tối ưu hóa tài liệu PDF.
- Bạn có thể thử ứng dụng miễn phí của chúng tôi để kiểm tra tính năng.
- Tài Nguyên Học Tập
- Tài Liệu
- Mã Nguồn
- Tài Liệu API
- Hỗ Trợ Sản Phẩm
- Hỗ Trợ Miễn Phí
- Hỗ Trợ Trả Phí
- Blog
- Tại Sao Chọn Aspose.PDF Cloud cho Go?
- Danh Sách Khách Hàng
- Bảo Mật