HTML JPG PDF XML DOCX
  Product Family
PDF

تحليل ملفات PDF لاستخراج حقول النماذج كملفات XML في Python SDK

API لتحليل وثائق PDF لاستخراج حقول النماذج كملفات XML باستخدام API Python على الخادم.

Get Started

كيفية تحليل وثائق PDF لاستخراج حقول النماذج كملفات XML باستخدام Cloud Python SDK

لتحليل وثائق PDF لاستخراج حقول النماذج كملفات XML عبر Cloud Python SDK، سنستخدم Aspose.PDF Cloud Python SDK تساعد حزمة SDK السحابية هذه مطوري Python في تطوير تطبيقات إنشاء وتحرير وتحويل وتحليل PDF المستندة إلى السحابة باستخدام لغة البرمجة Python عبر Aspose.PDF REST API. ببساطة، أنشئ حسابًا في Aspose for Cloud واحصل على معلومات التطبيق الخاصة بك. بمجرد حصولك على App SID والمفتاح، ستكون مستعدًا لاستخدام Aspose.PDF Cloud Python SDK. إذا كانت حزمة Python موجودة على Github، يمكنك التثبيت مباشرة من Github:

التثبيت من Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

أمر وحدة التحكم في مدير الحزم

     
    pip install asposepdfcloud

خطوات تحليل PDF لاستخراج حقول النماذج كملفات XML باستخدام Python SDK

يمكن لمطوري Aspose.PDF Cloud بسهولة تحليل وثائق PDF لاستخراج حقول النماذج كملفات XML. يحتاج المطورون إلى بضع أسطر من الكود فقط.

  1. إنشاء كائن تكوين جديد مع المفتاح السري للتطبيق والمفتاح
  2. إنشاء كائن للاتصال بـ Cloud API
  3. تحميل ملف الوثيقة الخاص بك
  4. تحليل وثائق PDF لاستخراج حقول النماذج كملفات XML في التخزين السحابي باستخدام وظيفة put_export_fields_from_pdf_to_xml_in_storage
  5. التحقق من الاستجابة وتسجيل النتيجة
  6. تنزيل ملف XML محليًا إذا لزم الأمر
 

يعرض هذا الكود العينة تحليل وثيقة PDF لاستخراج حقول النماذج كملفات XML


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ExportFormToXML:
    """Class for extracting PDF form fields into XML using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str,  output_prefix: str):
        """Download the processed PDF document from the Aspose Cloud server."""
        if self.pdf_api:
            try:
                temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
                local_path = localFolder / ( output_prefix + outputDocument )
                shutil.move(temp_file, str(local_path))
                logging.info(f"download_result(): File successfully downloaded: {local_path}")
            except Exception as e:
                logging.error(f"download_result(): Failed to download file: {e}")


    def Extract(self, documentName: str, outputXMLName: str, localFolder: Path, remoteFolder: str ):
        self.uploadDocument(documentName, remoteFolder)

        XMLPath = str(Path.joinpath(Path(remoteFolder), outputXMLName))
        opts = {
            "folder": remoteFolder
        }
        response = self.pdf_put_export_fields_from_pdf_to_xml_in_storage(documentName, XMLPath, **opts)
        if response.code != 200:
            logging.error("ExportFormToXML(): Unexpected error!")
        else:
            logging.info(f"ExportFormToXML(): Pdf document '{documentName}' form fields successfully exported to '{outputXMLName}' file.")
            self.downloadFile(outputXMLName, outputXMLName, localFolder, remoteFolder, "")
 

العمل مع تحليل النماذج في PDF عبر Python SDK

من خلال تحليل وثائق PDF لاستخراج حقول النماذج كملفات XML، يمكن التحقق بشكل منهجي من صلاحية وملاءمة كل حقل نموذج، مما يضمن أن جميع المراجع حديثة وعملية. لأداء مهام مثل تنزيل حقول النماذج كملفات XML أو إجراء تحليلات مجمعة، يمكن لاستخراج حقول النماذج تمكين الأتمتة، مما يوفر الوقت ويقلل من الجهد اليدوي. تحليل وثائق PDF لاستخراج حقول النماذج كملفات XML مع Aspose.PDF Cloud Python SDK.

مع حزمة SDK لـ Python، يمكنك

  • إضافة رأس وتذييل لوثيقة PDF بتنسيق نصي أو صورة.
  • إضافة جداول وختم نصي أو صورة إلى وثائق PDF.
  • إلحاق وثائق PDF متعددة إلى ملف موجود.
  • العمل مع مرفقات PDF والتعليقات التوضيحية وحقول النماذج.
  • تطبيق التشفير أو فك التشفير على وثائق PDF وتعيين كلمة مرور.
  • حذف جميع الأختام والجداول من صفحة أو من وثيقة PDF بالكامل.
  • حذف ختم أو جدول محدد من وثيقة PDF بواسطة معرفه.
  • استبدال مثيل واحد أو متعدد للنص في صفحة PDF أو من الوثيقة بأكملها.
  • دعم واسع لتحويل وثائق PDF إلى تنسيقات ملفات أخرى متنوعة.
  • استخراج عناصر متنوعة من ملفات PDF وجعل وثائق PDF محسنة.
  • يمكنك تجربة التطبيق المجاني لاختبار الوظائف.

  •