Mem-parse PDF untuk ekstraksi Teks berdasarkan nama di Python SDK

API untuk mem-parse dokumen PDF ke ekstraksi teks berdasarkan nama menggunakan API Python sisi server.

Get Started

NET PHP GO NODEJS

Cara mem-parse dokumen PDF untuk ekstraksi Teks berdasarkan nama menggunakan Cloud Python SDK

Untuk mem-parse dokumen PDF ke ekstraksi Teks berdasarkan nama melalui Cloud Python SDK, kita akan menggunakan Aspose.PDF Cloud Python SDK Cloud SDK ini membantu pemrogram Python dalam mengembangkan aplikasi pembuat, anotator, editor, konverter, dan parser PDF berbasis cloud menggunakan bahasa pemrograman Python melalui Aspose.PDF REST API. Cukup buat akun di Aspose for Cloud dan dapatkan informasi aplikasi Anda. Setelah Anda memiliki App SID & kunci, Anda siap untuk menggunakan Aspose.PDF Cloud Python SDK. Jika paket python di-host di Github, Anda dapat menginstal langsung dari Github:

Instalasi dari Github
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Langkah-langkah untuk mem-parse PDF ke ekstraksi Teks berdasarkan nama menggunakan Python SDK

Pengembang Aspose.PDF Cloud dapat dengan mudah mem-parse dokumen PDF untuk ekstraksi Teks berdasarkan nama. Pengembang hanya memerlukan beberapa baris kode.

Buat objek Konfigurasi baru dengan Rahasia Aplikasi dan Kunci Anda
Buat objek untuk menghubungkan ke Cloud API
Unggah file dokumen Anda
Mem-parse dokumen PDF untuk ekstraksi Teks berdasarkan nama di penyimpanan cloud menggunakan fungsi get_text_box_field
Periksa respons dan catat hasilnya
Unduh info Text box dalam file JSON secara lokal jika diperlukan

Kode contoh ini menunjukkan mem-parse dokumen PDF untuk ekstraksi Teks berdasarkan nama
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractTextBox:
    """Class for extracting text box from PDF document using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

   def Extract(self, documentName: str, texxtboxName: str, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
	response = self.pdf_api.get_text_box_field(documentName, textboxName, **opts)
        if response.code != 200:
            logging.error("ParseExtractTextBox(): Unexpected error!")
        else:
	    logging.info(f"ParseExtractTextBox(): TextBox field '{textboxName}' successfully extracted from the document '{documentName}'.")
            localJsonFile = str(Path.joinpath(localFolder, "text_box_objects.json"))
            with open(localJsonFile, "w", encoding="utf-8") as localFile:            
               jsText = json.dumps(response.field.__dict__, ensure_ascii=False, default=str, indent=4)
               localFile.write(jsText)

Bekerja dengan parsing Teks di PDF melalui Python SDK

Dengan mem-parse dokumen PDF untuk ekstraksi teks berdasarkan nama, Anda dapat memodifikasi konten bidang TextBox sesuai kebutuhan. Ini mempertahankan posisi teks di dokumen sambil menghemat waktu dan mengurangi pekerjaan manual. Mem-parse dokumen PDF untuk ekstraksi teks berdasarkan nama dengan Aspose.PDF Cloud Python SDK.

Dengan Python SDK kami Anda dapat

Menambahkan header & footer dokumen PDF dalam format teks atau gambar.
Menambahkan tabel & stempel teks atau gambar ke dokumen PDF.
Menggabungkan beberapa dokumen PDF ke file yang sudah ada.
Bekerja dengan lampiran PDF, anotasi, & bidang formulir.
Menerapkan enkripsi atau dekripsi ke dokumen PDF & mengatur kata sandi.
Menghapus semua stempel & tabel dari halaman atau seluruh dokumen PDF.
Menghapus stempel atau tabel tertentu dari dokumen PDF berdasarkan ID-nya.
Mengganti satu atau beberapa instance teks pada halaman PDF atau dari seluruh dokumen.
Dukungan luas untuk mengonversi dokumen PDF ke berbagai format file lainnya.
Mengekstraksi berbagai elemen dari file PDF & membuat dokumen PDF teroptimasi.
Anda dapat mencoba Aplikasi gratis kami untuk menguji fungsionalitasnya.

Mengapa Aspose.PDF Cloud untuk Python?
Daftar Pelanggan
Keamanan

Mem-parse PDF untuk ekstraksi Teks berdasarkan nama di Python SDK

API untuk mem-parse dokumen PDF ke ekstraksi teks berdasarkan nama menggunakan API Python sisi server.

Aspose.PDF Cloud SDK untuk Python

Overview

Cara mem-parse dokumen PDF untuk ekstraksi Teks berdasarkan nama menggunakan Cloud Python SDK

Instalasi dari Github

Langkah-langkah untuk mem-parse PDF ke ekstraksi Teks berdasarkan nama menggunakan Python SDK

Kode contoh ini menunjukkan mem-parse dokumen PDF untuk ekstraksi Teks berdasarkan nama

Bekerja dengan parsing Teks di PDF melalui Python SDK