HTML JPG PDF XML DOCX
  Product Family
PDF

Mem-parsing PDF untuk ekstraksi tabel di Node.js SDK

API untuk mem-parsing dokumen PDF untuk mengekstrak tabel menggunakan API Node.js sisi server.

Get Started

Cara mem-parsing dokumen PDF untuk ekstraksi tabel menggunakan Cloud Node.js SDK

Untuk mem-parsing dokumen PDF untuk mengekstrak tabel melalui Cloud Node.js SDK, kami akan menggunakan Aspose.PDF Cloud Node.js SDK Cloud SDK ini membantu programmer Node.js dalam mengembangkan aplikasi pembuat, annotator, editor, konverter, dan parser PDF berbasis cloud menggunakan bahasa pemrograman Node.js melalui Aspose.PDF REST API. Cukup buat akun di Aspose for Cloud dan dapatkan informasi aplikasi Anda. Setelah Anda memiliki App SID & key, Anda siap untuk menggunakan Aspose.PDF Cloud Node.js SDK.

Perintah Konsol Manajer Paket


     
    npm install asposepdfcloud --save
     
     

Langkah-langkah untuk mem-parsing PDF untuk ekstraksi tabel menggunakan Node.js SDK

Pengembang Aspose.PDF Cloud dapat dengan mudah mem-parsing dokumen PDF untuk ekstraksi tabel. Pengembang hanya memerlukan beberapa baris kode.

  1. Buat objek Konfigurasi baru dengan Rahasia Aplikasi dan Kunci Anda
  2. Buat objek untuk menghubungkan ke Cloud API
  3. Unggah file dokumen Anda
  4. Mem-parsing dokumen PDF untuk ekstraksi tabel di penyimpanan cloud menggunakan fungsi getDocumentTables
  5. Periksa respons dan catat hasilnya
  6. Unduh informasi tabel dalam file JSON secara lokal jika diperlukan
 

Kode contoh ini menunjukkan mem-parsing dokumen PDF untuk ekstraksi tabel


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTables};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTables = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getDocumentTables( documentName, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportTables(): Tables successfully extracted!");

                var result = "[\n";
                await Promise.all(
                    response.body.tables.list.map(async (table) => {
                        const responseTable = await pdfApi.getTable(documentName, table.id, null, remoteFolder)
                            .then(function(responseTable){
                                result += JSON.stringify(table) + ",\n\n";
                            });
                        })
                    );
                result += "]";

                const filePath = path.join(localFolder, "parsed_tables_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTables(): Unexpected error!") 

        }
    }
};
 

Bekerja dengan pem-parsing tabel dalam PDF melalui Node.js SDK

Dengan mem-parsing dokumen PDF untuk ekstraksi tabel, Anda dapat memodifikasi konten tabel sesuai kebutuhan. Ini mempertahankan posisi tabel dalam dokumen sambil menghemat waktu dan mengurangi pekerjaan manual. Mem-parsing dokumen PDF untuk mengekstraksi tabel dengan Aspose.PDF Cloud Node.js SDK.

Dengan SDK Node.js kami Anda dapat

  • Menambahkan header & footer dokumen PDF dalam format teks atau gambar.
  • Menambahkan tabel & stempel teks atau gambar ke dokumen PDF.
  • Menyisipkan beberapa dokumen PDF ke dalam file yang sudah ada.
  • Bekerja dengan lampiran PDF, anotasi, & bidang formulir.
  • Terapkan enkripsi atau dekripsi ke dokumen PDF & atur kata sandi.
  • Hapus semua stempel & tabel dari halaman atau seluruh dokumen PDF.
  • Hapus stempel atau tabel tertentu dari dokumen PDF dengan ID-nya.
  • Ganti satu atau beberapa instance teks pada halaman PDF atau dari seluruh dokumen.
  • Dukungan luas untuk mengonversi dokumen PDF ke berbagai format file lainnya.
  • Ekstrak berbagai elemen dari file PDF & optimalkan dokumen PDF.
  • Anda dapat mencoba Aplikasi gratis kami untuk menguji fungsionalitas.

  •