Phân tích PDF để trích xuất văn bản trong .NET SDK
API để phân tích tài liệu PDF nhằm trích xuất văn bản bằng cách sử dụng API phía máy chủ .NET.
Get StartedCách phân tích tài liệu PDF để trích xuất văn bản bằng Cloud .NET SDK
Để phân tích tài liệu PDF để trích xuất văn bản qua Cloud .NET SDK, chúng ta sẽ sử dụng Aspose.PDF Cloud .NET SDK Cloud .NET SDK này cho phép bạn dễ dàng xây dựng các ứng dụng tạo, chỉnh sửa & chuyển đổi PDF dựa trên đám mây bằng C#, ASP.NET, hoặc các ngôn ngữ .NET khác cho nhiều nền tảng đám mây khác nhau. Mở NuGet trình quản lý gói, tìm kiếm Aspose.PDF Cloud và cài đặt. Bạn cũng có thể sử dụng lệnh sau từ Bảng điều khiển Trình quản lý Gói.
Lệnh Bảng điều khiển Trình quản lý Gói
PM> Install-Package Aspose.Pdf-Cloud
Các bước để phân tích PDF nhằm trích xuất văn bản bằng .NET SDK
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất văn bản. Các nhà phát triển chỉ cần vài dòng mã.
- Tạo một đối tượng Cấu hình mới với Mật khẩu và Khóa Ứng dụng của bạn
- Tạo một đối tượng để kết nối với Cloud API
- Tải lên tệp tài liệu của bạn
- Phân tích tài liệu PDF để trích xuất văn bản trong lưu trữ đám mây bằng hàm GetDocumentTextBoxFieldsAsync
- Kiểm tra phản hồi và ghi lại kết quả
- Nếu hoạt động thành công, in ra các văn bản đã trích xuất
Mã mẫu này hiển thị việc phân tích tài liệu PDF để trích xuất văn bản
using Aspose.Pdf.Cloud.Sdk.Model;
namespace Parser
{
public class GetTextBoxes
{
public static async Task Extract(string documentName, string remoteFolder)
{
// Get your AppSid and AppSecret from https://dashboard.aspose.cloud (free registration required).
pdfApi = new PdfApi(AppSecret, AppSid);
using (var file = File.OpenRead(Path.Combine(localFolder, documentName)))
{ // Upload the local PDF to cloud storage folder name.
FilesUploadResult uploadResponse = await pdfApi.UploadFileAsync(Path.Combine(remoteFolder, documentName), documentName);
Console.WriteLine(uploadResponse.Uploaded[0]);
}
// Parse PDF to extract text boxes in cloud storage.
TextBoxFieldsResponse response = await pdfApi.GetDocumentTextBoxFieldsAsync(documentName, folder: remoteFolder);
// Checks the response and logs the result.
if (response == null)
Console.WriteLine("GetTextBoxes(): Unexpected error!");
else if (response.Code < 200 || response.Code > 299)
Console.WriteLine("GetTextBoxes(): Failed to receive TextBox fields from the document.");
else
{ // Show text boxes.
Console.WriteLine("GetTextBoxes(): TextBox fields successfully received from the document '{0}.", documentName);
foreach (TextBoxField textBox in response.Fields.List)
{
Console.WriteLine(textBox.ToString());
}
}
}
}
}
Làm việc với việc phân tích văn bản trong PDF qua .NET SDK
Bằng cách phân tích tài liệu PDF để trích xuất văn bản, bạn có thể chỉnh sửa nội dung của các trường TextBox theo nhu cầu. Điều này duy trì vị trí của văn bản trong tài liệu trong khi tiết kiệm thời gian và giảm bớt công việc thủ công. Phân tích tài liệu PDF để trích xuất văn bản với Aspose.PDF Cloud .NET SDK.
Với .NET SDK của chúng tôi, bạn có thể
- Thêm đầu trang & chân trang của tài liệu PDF ở định dạng văn bản hoặc hình ảnh.
- Thêm bảng & dấu văn bản hoặc hình ảnh vào tài liệu PDF.
- Nối nhiều tài liệu PDF vào một tệp hiện có.
- Làm việc với các tệp đính kèm, chú thích, & trường biểu mẫu của PDF.
- Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
- Xóa tất cả các dấu & bảng từ một trang hoặc toàn bộ tài liệu PDF.
- Xóa một dấu hoặc bảng cụ thể từ tài liệu PDF theo ID của nó.
- Thay thế một hoặc nhiều lần xuất hiện của văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
- Hỗ trợ rộng rãi cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác nhau.
- Trích xuất nhiều yếu tố của các tệp PDF & tối ưu hóa tài liệu PDF.
- Bạn có thể thử ứng dụng miễn phí của chúng tôi để kiểm tra chức năng.
- Tài Nguyên Học Tập
- Tài Liệu
- Mã Nguồn
- Tham Khảo API
- Hỗ Trợ Sản Phẩm
- Hỗ Trợ Miễn Phí
- Hỗ Trợ Trả Phí
- Blog
- Tại Sao Chọn Aspose.PDF Cloud cho .NET?
- Danh Sách Khách Hàng
- Bảo Mật