Phân tích PDF để trích xuất trường biểu mẫu dưới dạng XML trong Java SDK
API để phân tích tài liệu PDF và trích xuất trường biểu mẫu dưới dạng XML bằng API Java phía máy chủ.
Get StartedCách phân tích tài liệu PDF để trích xuất trường biểu mẫu dưới dạng XML bằng Cloud Java SDK
Để phân tích tài liệu PDF và trích xuất trường biểu mẫu dưới dạng XML qua Cloud Java SDK, chúng tôi sẽ sử dụng Aspose.PDF Cloud Java SDK Cloud Java SDK này cho phép bạn dễ dàng xây dựng các ứng dụng tạo, chỉnh sửa và chuyển đổi PDF dựa trên đám mây bằng ngôn ngữ Java cho nhiều nền tảng đám mây. Mở Repository trình quản lý gói, tìm kiếm Aspose.PDF Cloud và cài đặt. Bạn cũng có thể sử dụng lệnh sau từ Package Manager Console để cài đặt bằng Maven.
Thêm kho lưu trữ Aspose Cloud vào tệp pom.xml của ứng dụng
Thêm kho lưu trữ Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Để cài đặt thư viện khách hàng API vào kho Maven cục bộ của bạn, chỉ cần thực thi:
Cài đặt từ Github
mvn clean install
Để triển khai nó vào kho Maven từ xa, hãy cấu hình cài đặt của kho và thực thi:
Triển khai kho Maven
mvn clean deploy
Các bước để phân tích PDF và trích xuất trường biểu mẫu dưới dạng XML bằng Java SDK
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất trường biểu mẫu dưới dạng XML. Chỉ cần một vài dòng mã.
- Tạo một đối tượng Configuration mới với Application Secret và Key của bạn
- Tạo một đối tượng để kết nối với Cloud API
- Tải lên tệp tài liệu của bạn
- Phân tích tài liệu PDF để trích xuất trường biểu mẫu dưới dạng XML trong lưu trữ đám mây bằng hàm getExportFieldsFromPdfToXmlInStorage
- Kiểm tra phản hồi và ghi lại kết quả
- Tải tệp XNL về máy cục bộ nếu cần
Mã mẫu này hiển thị cách phân tích tài liệu PDF để trích xuất trường biểu mẫu dưới dạng XML
import java.io.File;
import java.nio.file.Path;
import java.nio.file.StandardCopyOption;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdfusecases.pages.PagesHelper;
public class ParseFormsXml {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String XML_OUTPUT_FILE = "output_sample.xml";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
//Perform action
File f = pdfApi.getExportFieldsFromPdfToXmlInStorage(PDF_DOCUMENT, null, REMOTE_FOLDER);
// save file
java.nio.file.Files.copy(Path.of(f.getPath()), Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE), StandardCopyOption.REPLACE_EXISTING);
System.out.println(String.format("File '%s' successfully dowloaded!", Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE).toString()));
System.out.println("Successfully parsed PDF fields as XML ! '" + XML_OUTPUT_FILE + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
Làm việc với việc phân tích biểu mẫu trong PDF qua .NET SDK
Bằng cách phân tích tài liệu PDF để trích xuất trường biểu mẫu dưới dạng XML, người dùng có thể kiểm tra một cách hệ thống tính hợp lệ và mức độ liên quan của từng trường biểu mẫu, đảm bảo mọi tham chiếu đều hiện tại và hoạt động. Đối với các nhiệm vụ như tải xuống trường biểu mẫu dưới dạng XML hoặc thực hiện phân tích hàng loạt, việc trích xuất trường biểu mẫu cho phép tự động hoá, tiết kiệm thời gian và giảm công sức thủ công. Phân tích tài liệu PDF để trích xuất trường biểu mẫu dưới dạng XML với Aspose.PDF Cloud Java SDK.
Với Java SDK của chúng tôi, bạn có thể
- Thêm tiêu đề và chân trang tài liệu PDF ở định dạng văn bản hoặc hình ảnh.
- Thêm bảng và dấu văn bản hoặc hình ảnh vào tài liệu PDF.
- Gắn nối nhiều tài liệu PDF vào một tệp hiện có.
- Làm việc với tệp đính kèm PDF, chú thích và trường biểu mẫu.
- Áp dụng mã hoá hoặc giải mã cho tài liệu PDF và đặt mật khẩu.
- Xóa tất cả dấu và bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
- Xóa một dấu hoặc bảng cụ thể khỏi tài liệu PDF bằng ID của chúng.
- Thay thế một hoặc nhiều hiện xuất của văn bản trên một trang PDF hoặc toàn bộ tài liệu.
- Hỗ trợ mở rộng việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác nhau.
- Trích xuất các thành phần khác nhau của tệp PDF và tối ưu hóa tài liệu PDF.
- Bạn có thể thử ứng dụng miễn phí của chúng tôi để kiểm tra chức năng.
- Tài Nguyên Học Tập
- Tài liệu
- Mã nguồn
- Tham khảo API
- Hỗ Trợ Sản Phẩm
- Hỗ trợ miễn phí
- Hỗ trợ trả phí
- Blog
- Tại sao Aspose.PDF Cloud cho Java?
- Danh sách khách hàng
- Bảo mật