HTML JPG PDF XML DOCX
  Product Family
PDF

Parse PDF untuk ekstraksi Tabel dalam Java SDK

API untuk mem-parsing dokumen PDF guna mengekstrak tabel menggunakan API Java sisi server.

Get Started

Cara mem-parsing dokumen PDF untuk ekstraksi Tabel menggunakan Cloud Java SDK

Untuk mem-parsing dokumen PDF guna mengekstrak Tabel via Cloud Java SDK, kami akan menggunakan Aspose.PDF Cloud Java SDK Cloud Java SDK ini memungkinkan Anda dengan mudah membangun aplikasi pembuat, penyunting, dan pengonversi PDF berbasis cloud dalam bahasa Java untuk berbagai platform cloud. Buka Repository paket manager, cari Aspose.PDF Cloud dan instal. Anda juga dapat menggunakan perintah berikut dari Package Manager Console untuk menginstalnya menggunakan Maven.

Tambahkan repositori Aspose Cloud ke file pom.xml aplikasi Anda

Tambahkan repositori Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Untuk menginstal pustaka klien API ke repositori Maven lokal Anda, cukup jalankan:

Instalasi dari Github


    mvn clean install

Untuk menyebarkannya ke repositori Maven remote sebagai alternatif, konfigurasikan pengaturan repositori dan jalankan:

Deploy repositori Maven


    mvn clean deploy

Langkah-langkah untuk mem-parsing PDF untuk ekstraksi Tabel menggunakan Java SDK

Pengembang Aspose.PDF Cloud dapat dengan mudah mem-parsing dokumen PDF untuk ekstraksi Tabel. Pengembang hanya memerlukan beberapa baris kode.

  1. Buat objek Configuration baru dengan Secret dan Key Aplikasi Anda
  2. Buat objek untuk terhubung ke Cloud API
  3. Unggah file dokumen Anda
  4. Parse dokumen PDF untuk ekstraksi Tabel di penyimpanan cloud menggunakan fungsi getDocumentTables
  5. Periksa respons dan catat hasilnya
  6. Jika operasi berhasil, cetak tabel yang diekstrak
 

Contoh kode ini menunjukkan cara mem-parsing dokumen PDF untuk ekstraksi Tabel


    import java.io.File;
    import java.nio.file.Files;
    import java.nio.file.OpenOption;
    import java.nio.file.StandardOpenOption;
    import java.nio.file.Path;
    import com.google.gson.Gson;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class ParseGetTables {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String OUTPUT_FILE     = "parsed_tables_output.json";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // perform action
                TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null,  REMOTE_FOLDER);
                System.out.println("Tables extracted status: " + response.getStatus());

                String jsonResult = "[\n";
                for (TableRecognized tableDef : response.getTables().getList()) {
                    String jsonTable = new Gson().toJson(tableDef);
                    jsonResult += jsonTable + ",\n\n";
                }
                jsonResult +="]";

                // save json
                Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
                byte[] strToBytes = jsonResult.getBytes();
                Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
            
                System.out.println("Tables successfully extracted to: '" + path + "'");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Bekerja dengan parsing Tabel dalam PDF via Java SDK

Dengan mem-parsing dokumen PDF untuk ekstraksi tabel, Anda dapat memodifikasi konten Tabel sesuai kebutuhan. Ini mempertahankan posisi tabel dalam dokumen sambil menghemat waktu dan mengurangi pekerjaan manual. Parse dokumen PDF untuk mengekstrak tabel dengan Aspose.PDF Cloud Java SDK.

Dengan Java SDK kami, Anda dapat

  • Tambahkan header & footer dokumen PDF dalam format teks atau gambar.
  • Tambahkan tabel & stempel teks atau gambar ke dokumen PDF.
  • Gabungkan beberapa dokumen PDF ke dalam satu file yang sudah ada.
  • Bekerja dengan lampiran PDF, anotasi, & bidang formulir.
  • Terapkan enkripsi atau dekripsi pada dokumen PDF & atur kata sandi.
  • Hapus semua stempel & tabel dari halaman atau seluruh dokumen PDF.
  • Hapus stempel atau tabel tertentu dari dokumen PDF berdasarkan ID-nya.
  • Ganti satu atau beberapa kemunculan teks pada halaman PDF atau dari seluruh dokumen.
  • Dukungan luas untuk mengonversi dokumen PDF ke berbagai format file lainnya.
  • Ekstrak berbagai elemen file PDF & buat dokumen PDF yang dioptimalkan.
  • Anda dapat mencoba Aplikasi gratis kami untuk menguji fungsionalitas.

  •