HTML JPG PDF XML DOCX
  Product Family
PDF

Mengurai PDF untuk mengekstraksi Teks di Node.js SDK

API untuk mengurai dokumen PDF untuk mengekstraksi teks menggunakan API Node.js sisi server.

Get Started

Cara mengurai dokumen PDF untuk mengekstraksi Teks menggunakan Cloud Node.js SDK

Untuk mengurai dokumen PDF untuk mengekstraksi Teks melalui Cloud Node.js SDK, kita akan menggunakan Aspose.PDF Cloud Node.js SDK SDK Cloud ini membantu programmer Node.js dalam mengembangkan aplikasi pembuat, anotator, editor, konverter, dan pengurai PDF berbasis cloud menggunakan bahasa pemrograman Node.js melalui Aspose.PDF REST API. Cukup buat akun di Aspose for Cloud dan dapatkan informasi aplikasi Anda. Setelah Anda memiliki App SID & key, Anda siap menggunakan Aspose.PDF Cloud Node.js SDK.

Perintah Konsol Pengelola Paket


     
    npm install asposepdfcloud --save
     
     

Langkah-langkah untuk mengurai PDF untuk mengekstraksi Teks menggunakan Node.js SDK

Pengembang Aspose.PDF Cloud dapat dengan mudah mengurai dokumen PDF untuk mengekstraksi Teks. Pengembang hanya membutuhkan beberapa baris kode.

  1. Buat objek Konfigurasi baru dengan Rahasia dan Kunci Aplikasi Anda
  2. Buat objek untuk terhubung ke API Cloud
  3. Unggah file dokumen Anda
  4. Mengurai dokumen PDF untuk mengekstraksi Teks di penyimpanan cloud menggunakan fungsi getDocumentTextBoxFields
  5. Periksa respons dan catat hasilnya
  6. Unduh informasi kotak Teks dalam file JSON secara lokal jika diperlukan
 

Kode contoh ini menunjukkan penguraian dokumen PDF untuk mengekstraksi Teks


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTextBoxes};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTextBoxes = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getDocumentTextBoxFields( documentName, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportTextBoxes(): TextBox Fileds successfully extracted!");
                
                var result = "[\n";
                await Promise.all(
                    response.body.fields.list.map(async (textbox) => {
                        const responseText = await pdfApi.getTextBoxField(documentName, textbox.fullName, null, remoteFolder)
                            .then(function(responseTextBox){
                                result += JSON.stringify(textbox) + ",\n\n";
                            });
                        })
                    );
                result += "]";

                const filePath = path.join(localFolder, "parsed_text_boxes_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTextBoxes(): Unexpected error!") 

        }
    }
};
 

Bekerja dengan penguraian Teks dalam PDF melalui Node.js SDK

Dengan mengurai dokumen PDF untuk ekstraksi teks, Anda dapat memodifikasi konten kotak Teks sesuai kebutuhan. Ini mempertahankan posisi teks dalam dokumen sambil menghemat waktu dan mengurangi pekerjaan manual. Mengurai dokumen PDF untuk mengekstraksi teks dengan Aspose.PDF Cloud Node.js SDK.

Dengan SDK Node.js kami, Anda dapat

  • Menambahkan header & footer dokumen PDF dalam format teks atau gambar.
  • Menambahkan tabel & stempel teks atau gambar ke dokumen PDF.
  • Menggabungkan beberapa dokumen PDF ke dalam file yang sudah ada.
  • Bekerja dengan lampiran PDF, anotasi, & bidang formulir.
  • Menerapkan enkripsi atau dekripsi ke dokumen PDF & menetapkan kata sandi.
  • Menghapus semua stempel & tabel dari halaman atau seluruh dokumen PDF.
  • Menghapus stempel atau tabel tertentu dari dokumen PDF berdasarkan ID-nya.
  • Mengganti satu atau beberapa instance teks pada halaman PDF atau dari seluruh dokumen.
  • Dukungan luas untuk mengonversi dokumen PDF ke berbagai format file lainnya.
  • Mengekstrak berbagai elemen file PDF & membuat dokumen PDF dioptimalkan.
  • Anda dapat mencoba App gratis kami untuk menguji fungsionalitasnya.

  •