Parse PDF untuk Ekstraksi Tabel berdasarkan Id di Python SDK
API untuk mem-parsing dokumen PDF untuk mengekstrak tabel berdasarkan Id menggunakan server-side Python API.
Get StartedCara mem-parsing dokumen PDF untuk Ekstraksi Tabel berdasarkan Id menggunakan Cloud Python SDK
Untuk mem-parsing dokumen PDF untuk ekstraksi Tabel berdasarkan Id via Cloud Python SDK, kita akan menggunakan Aspose.PDF Cloud Python SDK Cloud SDK ini membantu pemrogram Python dalam mengembangkan aplikasi pembuat, anotator, editor, konverter, dan parser PDF berbasis cloud menggunakan bahasa pemrograman Python melalui Aspose.PDF REST API. Cukup buat akun di Aspose for Cloud dan dapatkan informasi aplikasi Anda. Setelah Anda memiliki App SID & key, Anda siap menggunakan Aspose.PDF Cloud Python SDK. Jika paket python di-host di Github, Anda dapat menginstal langsung dari Github:
Instalasi dari Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Langkah-langkah untuk mem-parsing PDF untuk Ekstraksi Tabel berdasarkan Id menggunakan Python SDK
Pengembang Aspose.PDF Cloud dapat dengan mudah mem-parsing dokumen PDF untuk ekstraksi Tabel berdasarkan Id. Pengembang hanya membutuhkan beberapa baris kode.
- Buat objek Konfigurasi baru dengan Aplikasi Rahasia dan Kunci Anda
- Buat objek untuk terhubung ke Cloud API
- Unggah file dokumen Anda
- Mem-parsing dokumen PDF untuk ekstraksi Tabel berdasarkan Id di penyimpanan cloud menggunakan fungsi get_table
- Periksa respons dan catat hasilnya
- Unduh info Tabel dalam file JSON secara lokal jika diperlukan
Kode contoh ini menunjukkan mem-parsing dokumen PDF untuk Ekstraksi Tabel berdasarkan Id
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class ParseExtractTable:
"""Class for extracting table from PDF document page using Aspose PDF Cloud API."""
def __init__(self):
self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)
def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = localFolder / documentName
try:
if remoteFolder == None:
self.pdf_api.upload_file(documentName, str(file_path))
else:
opts = { "folder": remoteFolder }
self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
logging.info(f"File {documentName} uploaded successfully.")
except Exception as e:
logging.error(f"Failed to upload file: {e}")
def extract(self, documentName: str, tableId: str, remoteFolder: Path):
self.upload_document(documentName, remoteFolder)
opts = {
"folder": remoteFolder
}
response = self.pdf_api.get_table(documentName, tableId, **opts)
if response.code != 200:
logging.error("ParseExtractTextBox(): Unexpected error!")
else:
logging.info(f"ParseExtractTable(): Table '{tableId}' successfully extracted from the document '{documentName}'.")
localJsonFile = str(Path.joinpath(localFolder, "tables_objects.json"))
with open(localJsonFile, "w", encoding="utf-8") as localFile:
jsText = json.dumps(response.table.__dict__, ensure_ascii=False, default=str, indent=4)
localFile.write(jsText)
Bekerja dengan parsing Tabel berdasarkan Id di PDF melalui Python SDK
Dengan mem-parsing dokumen PDF untuk ekstraksi tabel berdasarkan Id, Anda dapat mengubah konten Tabel berdasarkan Id sesuai kebutuhan. Ini mempertahankan posisi tabel dalam dokumen sambil menghemat waktu dan mengurangi pekerjaan manual. Mem-parsing dokumen PDF untuk ekstraksi tabel berdasarkan Id dengan Aspose.PDF Cloud Python SDK.
Dengan Python SDK kami, Anda dapat
- Menambahkan header & footer dokumen PDF dalam format teks atau gambar.
- Menambahkan tabel & stempel teks atau gambar ke dokumen PDF.
- Menambahkan beberapa dokumen PDF ke file yang sudah ada.
- Bekerja dengan lampiran PDF, anotasi, & bidang formulir.
- Terapkan enkripsi atau dekripsi ke dokumen PDF & tetapkan kata sandi.
- Hapus semua stempel & tabel dari halaman atau seluruh dokumen PDF.
- Hapus stempel atau tabel tertentu dari dokumen PDF berdasarkan ID-nya.
- Ganti satu atau beberapa instance teks pada halaman PDF atau dari seluruh dokumen.
- Dukungan luas untuk mengonversi dokumen PDF ke berbagai format file lainnya.
- Ekstrak berbagai elemen dari file PDF & optimalkan dokumen PDF.
- Anda dapat mencoba Aplikasi gratis kami untuk menguji fungsionalitasnya.
- Sumber Pembelajaran
- Dokumentasi
- Kode Sumber
- Referensi API
- Dukungan Produk
- Dukungan Gratis
- Dukungan Berbayar
- Blog
- Mengapa Aspose.PDF Cloud untuk Python?
- Daftar Pelanggan
- Keamanan