HTML JPG PDF XML DOCX
  Product Family
PDF

Lấy các bảng trên trang từ PDF trong SDK Java

Lấy tất cả các bảng trên trang từ tài liệu PDF bằng API Java phía máy chủ.

Get Started

Cách trích xuất các bảng trên trang từ PDF qua Cloud Java SDK

Để trích xuất các bảng trên trang từ PDF qua Cloud Java SDK, chúng tôi sẽ sử dụng Aspose.PDF Cloud Java SDK SDK đám mây này cho phép bạn dễ dàng xây dựng các ứng dụng tạo, chỉnh sửa và chuyển đổi PDF dựa trên đám mây bằng C#, ASPJava hoặc các ngôn ngữ Java khác cho các nền tảng đám mây khác nhau. Mở Repository trình quản lý gói, tìm kiếm Aspose.PDF Cloud và cài đặt. Bạn cũng có thể sử dụng lệnh sau từ Package Manager Console để cài đặt nó bằng Maven.

Thêm kho lưu trữ Aspose Cloud vào pom.xml của ứng dụng của bạn

Thêm kho lưu trữ Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Để cài đặt thư viện client API vào kho Maven cục bộ của bạn, chỉ cần thực thi:

Cài đặt từ Github


    mvn clean install

Để triển khai nó vào kho Maven từ xa thay thế, hãy cấu hình các thiết lập của kho và thực thi:

Triển khai kho Maven


    mvn clean deploy

Các bước để trích xuất các bảng trên trang từ PDF qua Java SDK

Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng tải và lấy các bảng trên trang từ PDF chỉ trong vài dòng mã.

  1. Tạo một đối tượng Configuration mới với Application Secret và Key của bạn.
  2. Tạo một đối tượng để kết nối tới Cloud API.
  3. Tải lên PDF lên lưu trữ đám mây.
  4. Trích xuất các bảng trên trang từ PDF trong lưu trữ đám mây bằng hàm getPageTables.
  5. Kiểm tra phản hồi và ghi lại kết quả.
  6. Nếu thao tác thành công, in ra các bảng
 

Mã mẫu này hiển thị việc trích xuất các bảng trên trang từ tài liệu PDF


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtractOnPage {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
            Integer PAGE_NUMBER    = 1;

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getPageTables(PDF_DOCUMENT, PAGE_NUMBER, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Làm việc với Bảng trong PDF

Bảng cung cấp một định dạng có cấu trúc để trình bày dữ liệu một cách có hệ thống, giúp người đọc dễ dàng hiểu và phân tích thông tin. Chúng cũng nâng cao tính thẩm mỹ của tài liệu, thêm sự chuyên nghiệp và tổ chức. Khi làm việc với dữ liệu số hoặc so sánh, bảng cải thiện độ rõ ràng bằng cách nhóm các thông tin liên quan trong một định dạng dễ đọc. Ngoài ra, bảng có thể tích hợp nội dung thời gian thực hoặc được tạo động, chẳng hạn như dữ liệu từ cơ sở dữ liệu hoặc bảng điều khiển phân tích. Lấy tất cả các bảng trên trang từ tài liệu PDF bằng Aspose.PDF Cloud Java SDK.

Với thư viện Java của chúng tôi, bạn có thể:

  • Thêm tiêu đề & chân trang của tài liệu PDF ở dạng văn bản hoặc hình ảnh.
  • Thêm bảng & dấu (văn bản hoặc hình ảnh) vào tài liệu PDF.
  • Nối nhiều tài liệu PDF vào một tệp hiện có.
  • Làm việc với tệp đính kèm PDF, chú thích và trường biểu mẫu.
  • Áp dụng mã hoá hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
  • Xóa tất cả dấu và bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
  • Xóa một dấu hoặc bảng cụ thể khỏi tài liệu PDF bằng ID của nó.
  • Thay thế một hoặc nhiều trường hợp của văn bản trên một trang PDF hoặc trên toàn bộ tài liệu.
  • Hỗ trợ mở rộng việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác nhau.
  • Trích xuất các thành phần khác nhau của tệp PDF & tạo tài liệu PDF được tối ưu hoá.
  • Bạn có thể thử ứng dụng miễn phí của chúng tôi để trích xuất Bảng vào tệp PDF trực tuyến và kiểm tra chức năng.

  •