Phân tích PDF để trích xuất Bảng theo Id trong Java SDK
API để phân tích tài liệu PDF và trích xuất bảng theo Id bằng API Java phía máy chủ.
Get StartedCách phân tích tài liệu PDF để trích xuất Bảng theo Id bằng Cloud Java SDK
Để phân tích tài liệu PDF và trích xuất Bảng theo Id thông qua Cloud Java SDK, chúng tôi sẽ sử dụng Aspose.PDF Cloud Java SDK Cloud Java SDK này cho phép bạn dễ dàng xây dựng các ứng dụng tạo, chỉnh sửa & chuyển đổi PDF dựa trên đám mây bằng ngôn ngữ Java cho nhiều nền tảng đám mây. Mở Repository trình quản lý gói, tìm kiếm Aspose.PDF Cloud và cài đặt. Bạn cũng có thể sử dụng lệnh sau từ Console của Trình quản lý gói để cài đặt bằng Maven.
Thêm kho lưu trữ Aspose Cloud vào file pom.xml của ứng dụng của bạn
Thêm kho lưu trữ Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Để cài đặt thư viện client API vào kho Maven cục bộ của bạn, chỉ cần thực thi:
Cài đặt từ Github
mvn clean install
Để triển khai nó lên kho Maven từ xa, hãy cấu hình các thiết lập của kho và thực thi:
Triển khai kho Maven
mvn clean deploy
Các bước để phân tích PDF để trích xuất Bảng theo Id bằng Java SDK
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất Bảng theo Id. Chỉ cần một vài dòng mã.
- Tạo một đối tượng Configuration mới với Application Secret và Key của bạn
- Tạo một đối tượng để kết nối tới Cloud API
- Tải lên tệp tài liệu của bạn
- Phân tích tài liệu PDF để trích xuất Bảng theo Id trong lưu trữ đám mây bằng hàm getTable
- Kiểm tra phản hồi và ghi lại kết quả
- Nếu thao tác thành công, in ra bảng đã trích xuất
Mã mẫu này hiển thị cách phân tích tài liệu PDF để trích xuất Bảng theo Id
import java.io.File;
import java.nio.file.Files;
import java.nio.file.OpenOption;
import java.nio.file.Path;
import java.nio.file.StandardOpenOption;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TableRecognized;
import com.aspose.asposecloudpdf.model.TableRecognizedResponse;
import com.google.gson.Gson;
public class ParseGetTableById {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String OUTPUT_FILE = "parsed_table_output.json";
String TABLE_ID = "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// perform action
TableRecognizedResponse response = pdfApi.getTable(PDF_DOCUMENT, TABLE_ID, null, REMOTE_FOLDER);
System.out.println("Table extracted status: " + response.getStatus());
TableRecognized tableDef = response.getTable();
String jsonTable = new Gson().toJson(tableDef);
// save json
Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
byte[] strToBytes = jsonTable.getBytes();
Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
System.out.println("Table successfully extracted to: '" + path + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
Làm việc với việc phân tích Bảng theo Id trong PDF qua Java SDK
Bằng cách phân tích tài liệu PDF để trích xuất bảng theo Id, bạn có thể chỉnh sửa nội dung của Bảng theo Id theo nhu cầu. Điều này giữ nguyên vị trí của bảng trong tài liệu đồng thời tiết kiệm thời gian và giảm công việc thủ công. Phân tích tài liệu PDF để trích xuất bảng theo Id với Aspose.PDF Cloud Java SDK.
Với Java SDK của chúng tôi, bạn có thể
- Thêm header & footer cho tài liệu PDF dưới dạng văn bản hoặc hình ảnh.
- Thêm bảng & văn bản hoặc dấu ảnh vào tài liệu PDF.
- Nối nhiều tài liệu PDF vào một file hiện có.
- Làm việc với các tệp đính kèm PDF, chú thích và trường biểu mẫu.
- Áp dụng mã hóa hoặc giải mã cho tài liệu PDF và đặt mật khẩu.
- Xóa tất cả dấu và bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
- Xóa một dấu hoặc bảng cụ thể khỏi tài liệu PDF theo ID của nó.
- Thay thế một hoặc nhiều lần xuất hiện của văn bản trên một trang PDF hoặc trong toàn bộ tài liệu.
- Hỗ trợ rộng rãi việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác nhau.
- Trích xuất các thành phần khác nhau của tệp PDF và tối ưu hóa tài liệu PDF.
- Bạn có thể thử nghiệm ứng dụng miễn phí của chúng tôi để kiểm tra tính năng.
- Learning Resources
- Documentation
- Source Code
- API References
- Product Support
- Free Support
- Paid Support
- Blog
- Why Aspose.PDF Cloud for Java?
- Customers List
- Security