Mengurai PDF untuk ekstraksi Bidang Formulir sebagai XML dalam Python SDK
API untuk mengurai dokumen PDF untuk mengekstrak Bidang Formulir sebagai XML menggunakan server-side Python API.
Get StartedCara mengurai dokumen PDF untuk ekstraksi Bidang Formulir sebagai XML menggunakan Cloud Python SDK
Untuk mengurai dokumen PDF untuk mengekstrak Bidang Formulir sebagai XML melalui Cloud Python SDK, kita akan menggunakan Aspose.PDF Cloud Python SDK Cloud SDK ini membantu pemrogram Python dalam mengembangkan aplikasi pembuat, anotator, editor, konverter, dan parser PDF berbasis cloud menggunakan bahasa pemrograman Python melalui Aspose.PDF REST API. Cukup buat akun di Aspose for Cloud dan dapatkan informasi aplikasi Anda. Setelah Anda memiliki App SID & kunci, Anda siap mencoba Aspose.PDF Cloud Python SDK. Jika paket python dihosting di Github, Anda dapat menginstal langsung dari Github:
Instalasi dari Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Perintah Konsol Manajer Paket
pip install asposepdfcloud
Langkah-langkah untuk mengurai PDF untuk ekstraksi Bidang Formulir sebagai XML menggunakan Python SDK
Pengembang Aspose.PDF Cloud dapat dengan mudah mengurai dokumen PDF untuk ekstraksi Bidang Formulir sebagai XML. Pengembang hanya membutuhkan beberapa baris kode.
- Buat objek Konfigurasi baru dengan Rahasia Aplikasi dan Kunci Anda
- Buat objek untuk terhubung ke Cloud API
- Unggah file dokumen Anda
- Mengurai dokumen PDF untuk ekstraksi Bidang Formulir sebagai XML di penyimpanan cloud menggunakan fungsi put_export_fields_from_pdf_to_xml_in_storage
- Periksa respons dan catat hasilnya
- Unduh file XML secara lokal jika diperlukan
Kode contoh ini menunjukkan penguraian dokumen PDF untuk mengekstrak Bidang Formulir sebagai XML
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class ExportFormToXML:
"""Class for extracting PDF form fields into XML using Aspose PDF Cloud API."""
def __init__(self):
self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)
def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = localFolder / documentName
try:
if remoteFolder == None:
self.pdf_api.upload_file(documentName, str(file_path))
else:
opts = { "folder": remoteFolder }
self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
logging.info(f"File {documentName} uploaded successfully.")
except Exception as e:
logging.error(f"Failed to upload file: {e}")
def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str, output_prefix: str):
"""Download the processed PDF document from the Aspose Cloud server."""
if self.pdf_api:
try:
temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
local_path = localFolder / ( output_prefix + outputDocument )
shutil.move(temp_file, str(local_path))
logging.info(f"download_result(): File successfully downloaded: {local_path}")
except Exception as e:
logging.error(f"download_result(): Failed to download file: {e}")
def Extract(self, documentName: str, outputXMLName: str, localFolder: Path, remoteFolder: str ):
self.uploadDocument(documentName, remoteFolder)
XMLPath = str(Path.joinpath(Path(remoteFolder), outputXMLName))
opts = {
"folder": remoteFolder
}
response = self.pdf_put_export_fields_from_pdf_to_xml_in_storage(documentName, XMLPath, **opts)
if response.code != 200:
logging.error("ExportFormToXML(): Unexpected error!")
else:
logging.info(f"ExportFormToXML(): Pdf document '{documentName}' form fields successfully exported to '{outputXMLName}' file.")
self.downloadFile(outputXMLName, outputXMLName, localFolder, remoteFolder, "")
Bekerja dengan penguraian Formulir di PDF melalui Python SDK
Dengan mengurai dokumen PDF untuk ekstraksi Bidang Formulir sebagai XML, seseorang dapat secara sistematis memverifikasi validitas dan relevansi setiap Bidang Formulir, memastikan bahwa semua referensi terkini dan berfungsi. Untuk tugas-tugas seperti mengunduh Bidang Formulir sebagai XML atau melakukan analisis batch, ekstraksi Bidang Formulir memungkinkan otomatisasi, menghemat waktu dan mengurangi upaya manual. Mengurai dokumen PDF untuk mengekstrak Bidang Formulir sebagai XML dengan Aspose.PDF Cloud Python SDK.
Dengan Python SDK kami, Anda dapat
- Menambahkan header & footer dokumen PDF dalam format teks atau gambar.
- Menambahkan tabel & stempel teks atau gambar ke dokumen PDF.
- Menambahkan beberapa dokumen PDF ke file yang ada.
- Bekerja dengan lampiran PDF, anotasi, & bidang formulir.
- Menerapkan enkripsi atau dekripsi ke dokumen PDF & menetapkan kata sandi.
- Menghapus semua stempel & tabel dari halaman atau seluruh dokumen PDF.
- Menghapus stempel atau tabel tertentu dari dokumen PDF berdasarkan ID-nya.
- Mengganti satu atau beberapa instance teks pada halaman PDF atau dari seluruh dokumen.
- Dukungan luas untuk mengonversi dokumen PDF ke berbagai format file lainnya.
- Mengekstrak berbagai elemen file PDF & membuat dokumen PDF dioptimalkan.
- Anda dapat mencoba Aplikasi gratis kami untuk menguji fungsionalitasnya.
- Sumber Belajar
- Dokumentasi
- Kode Sumber
- Referensi API
- Dukungan Produk
- Dukungan Gratis
- Dukungan Berbayar
- Blog
- Mengapa Aspose.PDF Cloud untuk Python?
- Daftar Pelanggan
- Keamanan