HTML JPG PDF XML DOCX
  Product Family
PDF

استخراج المرفقات من PDF في Python SDK

API لاستخراج المرفقات في مستندات PDF مع Aspose.PDF Cloud Python SDK

Get Started

كيفية استخراج المرفقات من مستندات PDF باستخدام Cloud Python SDK

للعمل مع المرفقات في مستندات PDF، سنستخدم Aspose.PDF Cloud Python SDK يساعد هذا SDK السحابي مبرمجي Python في تطوير تطبيقات إنشاء PDF السحابية والمعلّق عليها والمحرر ومحول باستخدام لغة برمجة Python عبر Aspose.PDF REST API. افتح NPM مدير الحزم، ابحث عن Aspose.PDF Cloud، وقم بالتثبيت. يمكنك أيضًا استخدام الأمر التالي من وحدة التحكم في إدارة الحزم.

التثبيت من Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

أمر وحدة التحكم في إدارة الحزم

     
    pip install asposepdfcloud

خطوات الحصول على المرفقات عبر Python SDK

يمكن لمطوري Aspose.PDF Cloud Python بسهولة استخراج المرفقات من مستندات PDF. يحتاج المطورون إلى بضع سطور من الكود فقط.

  1. قم بتحميل سر التطبيق والمفتاح من ملف JSON أو تعيين الاعتمادات بطريقة أخرى
  2. إنشاء كائن للاتصال بـ Cloud API
  3. تعيين الاسم مع مسار ملف المستند الخاص بك
  4. تنفيذ إجراءات استخراج المرفقات
  5. سيحتوي الرد من وظيفة Cloud API على قائمة المرفقات

متطلبات النظام

من السهل البدء مع Aspose.PDF Cloud Python SDK ولا يوجد شيء لتثبيته. ببساطة قم بإنشاء حساب في Aspose for Cloud واحصل على معلومات التطبيق الخاصة بك. بمجرد حصولك على App SID & key، تكون مستعدًا لاستخدام Aspose.PDF Cloud Python SDK.

  • المعالج: 1GHz
  • الذاكرة العشوائية: 512Mb
  • مساحة خالية على القرص: 20Mb
  • أي نظام تشغيل من Microsoft Windows أو Mac OS أو Linux x32/x64
  • Python v4.8 أو أعلى

 

يعرض هذا الكود مثالًا على استخراج جميع مرفقات مستند PDF باستخدام PDF Cloud Python SDK


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, AttachmentsResponse, AttachmentResponse, Attachment

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample_file_with_attachment.pdf"
        ATTACHMENT_PATH = ""

    class PdfAttachments:
        """Class for managing PDF attachments using Aspose PDF Cloud API."""
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """Initialize the API client."""
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """Upload a PDF document to the Aspose Cloud server."""
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def get_attachments(self):
            """Get attachments for the PDF document."""
            if self.pdf_api:
                try:
                    response : AttachmentsResponse = self.pdf_api.get_document_attachments(Config.PDF_DOCUMENT_NAME)
                    if response.code == 200:
                        logging.info(f"get_attachmnets(): attachments '{response.attachments}' for the document '{Config.PDF_DOCUMENT_NAME}'.")
                        Config.ATTACHMENT_PATH = response.attachments.list[0].links[0].href
                    else:
                        logging.error(f"get_attachmnets(): Failed to get attachments to the document. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"get_attachmnets(): Error while adding attachment: {e}")

        def get_attachment_by_id(self):
            """Get attachment by Id for the PDF document and save it to local file."""
            if self.pdf_api:
                try:
                    response : AttachmentResponse = self.pdf_api.get_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
                    if response.code == 200:
                        attachment: Attachment = response.attachment
                        temp_file = self.pdf_api.get_download_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
                        local_path = Config.LOCAL_FOLDER / attachment.name
                        shutil.copy(temp_file, local_path)
                        logging.info(f"get_attachment_by_id(): attachment '{local_path}' for the document '{Config.PDF_DOCUMENT_NAME}' successfuly saved.")
                    else:
                        logging.error(f"get_attachment_by_id(): Failed to get attachment for the document '{Config.PDF_DOCUMENT_NAME}'. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"get_attachment_by_id(): Error while get attachment: {e}")


    if __name__ == "__main__":
        pdf_attachments = PdfAttachments()
        pdf_attachments.upload_document()
        pdf_attachments.get_attachments()
        pdf_attachments.get_attachment_by_id()