Phân tích PDF để trích xuất Văn bản theo tên trong Java SDK
API để phân tích tài liệu PDF và trích xuất văn bản theo tên bằng API Java phía máy chủ.
Get StartedCách phân tích tài liệu PDF để trích xuất Văn bản theo tên bằng Cloud Java SDK
Để phân tích tài liệu PDF và trích xuất Văn bản theo tên qua Cloud Java SDK, chúng tôi sẽ sử dụng Aspose.PDF Cloud Java SDK SDK Java Cloud này cho phép bạn dễ dàng xây dựng các ứng dụng tạo, chỉnh sửa và chuyển đổi PDF trên đám mây bằng ngôn ngữ Java cho nhiều nền tảng đám mây. Mở Repository trình quản lý gói, tìm kiếm Aspose.PDF Cloud và cài đặt. Bạn cũng có thể sử dụng lệnh sau từ Package Manager Console để cài đặt bằng Maven.
Thêm kho lưu trữ Aspose Cloud vào tệp pom.xml của ứng dụng
Thêm kho lưu trữ Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Để cài đặt thư viện client API vào kho Maven cục bộ của bạn, chỉ cần thực thi:
Cài đặt từ Github
mvn clean install
Để triển khai nó vào kho Maven từ xa, hãy cấu hình các cài đặt của kho và thực thi:
Triển khai kho Maven
mvn clean deploy
Các bước để phân tích PDF và trích xuất Văn bản theo tên bằng Java SDK
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất Văn bản theo tên. Chỉ cần một vài dòng mã.
- Tạo một đối tượng Configuration mới với Application Secret và Key của bạn
- Tạo một đối tượng để kết nối tới Cloud API
- Tải lên tệp tài liệu của bạn
- Phân tích tài liệu PDF để trích xuất Văn bản theo tên trong lưu trữ đám mây bằng hàm etTextBoxField
- Kiểm tra phản hồi và ghi lại kết quả
- Nếu thao tác thành công, in ra văn bản đã trích xuất
Mã mẫu này cho thấy cách phân tích tài liệu PDF để trích xuất Văn bản theo tên
import java.io.File;
import java.nio.file.Files;
import java.nio.file.OpenOption;
import java.nio.file.Path;
import java.nio.file.StandardOpenOption;
import com.google.gson.Gson;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TextBoxField;
import com.aspose.asposecloudpdf.model.TextBoxFieldResponse;
public class ParseGetTextBoxByName {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String OUTPUT_FILE = "parsed_text_box_field_output.json";
String TEXT_BOX_NAME = "_YOUR_FILED_NAME_";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// perform action
TextBoxFieldResponse response = pdfApi.getTextBoxField(PDF_DOCUMENT, TEXT_BOX_NAME, null, REMOTE_FOLDER);
System.out.println("TextBox fields extracted status: " + response.getStatus());
TextBoxField fieldDef = response.getField();
String jsonFiled = new Gson().toJson(fieldDef);
// save json
Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
byte[] strToBytes = jsonFiled.getBytes();
Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
System.out.println("TextBox field successfully extracted to: '" + path + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
Làm việc với việc phân tích Văn bản trong PDF qua Java SDK
Bằng cách phân tích tài liệu PDF để trích xuất văn bản theo tên, bạn có thể chỉnh sửa nội dung của trường TextBox khi cần. Điều này giữ nguyên vị trí của văn bản trong tài liệu đồng thời tiết kiệm thời gian và giảm công việc thủ công. Phân tích tài liệu PDF để trích xuất văn bản theo tên với Aspose.PDF Cloud Java SDK.
Với Java SDK của chúng tôi, bạn có thể
- Thêm phần đầu và phần chân của tài liệu PDF ở định dạng văn bản hoặc hình ảnh.
- Thêm bảng và dấu tem văn bản hoặc hình ảnh vào tài liệu PDF.
- Nối nhiều tài liệu PDF vào một tệp hiện có.
- Làm việc với tệp đính kèm PDF, chú thích và trường biểu mẫu.
- Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
- Xóa tất cả dấu và bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
- Xóa một dấu hoặc bảng cụ thể trong tài liệu PDF bằng ID của nó.
- Thay thế một hoặc nhiều đoạn văn bản trên một trang PDF hoặc trong toàn bộ tài liệu.
- Hỗ trợ rộng rãi việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác nhau.
- Trích xuất các thành phần khác nhau của tệp PDF & tối ưu hóa tài liệu PDF.
- Bạn có thể dùng thử ứng dụng miễn phí của chúng tôi để kiểm tra tính năng.
- Tài nguyên học tập
- Tài liệu
- Mã nguồn
- Tham chiếu API
- Hỗ trợ sản phẩm
- Hỗ trợ miễn phí
- Hỗ trợ trả phí
- Blog
- Tại sao chọn Aspose.PDF Cloud cho Java?
- Danh sách khách hàng
- Bảo mật