HTML JPG PDF XML DOCX
  Product Family
PDF

Trích Xuất Tệp Đính Kèm Từ PDF Trong Python SDK

API để trích xuất tệp đính kèm trong tài liệu PDF với Aspose.PDF Cloud Python SDK

Get Started

Cách trích xuất tệp đính kèm từ tài liệu PDF bằng Cloud Python SDK

Để làm việc với tệp đính kèm trong tài liệu PDF, chúng ta sẽ sử dụng Aspose.PDF Cloud Python SDK SDK Đám mây này hỗ trợ lập trình viên Python phát triển các ứng dụng tạo, chú thích, chỉnh sửa, và chuyển đổi PDF dựa trên đám mây bằng ngôn ngữ lập trình Python thông qua Aspose.PDF REST API. Mở NPM trình quản lý gói, tìm kiếm Aspose.PDF Cloud, và cài đặt. Bạn cũng có thể sử dụng lệnh sau từ Bảng điều khiển Quản lý Gói.

Cài đặt từ Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Lệnh Bảng Điều Khiển Quản Lý Gói

     
    pip install asposepdfcloud

Các bước để nhận tệp đính kèm qua Python SDK

Các nhà phát triển Aspose.PDF Cloud Python có thể dễ dàng trích xuất tệp đính kèm từ tài liệu PDF. Các nhà phát triển chỉ cần một vài dòng mã.

  1. Tải thông tin Bí mật và Khóa Ứng dụng từ tệp JSON hoặc đặt thông tin xác thực theo cách khác
  2. Tạo một đối tượng để kết nối với API Đám mây
  3. Đặt tên với đường dẫn của tệp tài liệu của bạn
  4. Thực hiện các hành động trích xuất tệp đính kèm
  5. Phản hồi từ chức năng API Đám mây sẽ chứa danh sách tệp đính kèm

Yêu Cầu Hệ Thống

Dễ dàng bắt đầu với Aspose.PDF Cloud Python SDK và không cần cài đặt. Chỉ cần tạo tài khoản tại Aspose for Cloud và nhận thông tin ứng dụng của bạn. Khi bạn đã có App SID & khóa, bạn sẵn sàng sử dụng Aspose.PDF Cloud Python SDK.

  • CPU: 1GHz
  • RAM: 512Mb
  • Dung lượng trống trên đĩa: 20Mb
  • Hệ điều hành bất kỳ Microsoft Windows, Mac OS, Linux x32/x64
  • Python v4.8 hoặc cao hơn

 

Mã mẫu này hiển thị cách trích xuất tất cả tệp đính kèm của tài liệu PDF sử dụng PDF Cloud Python SDK


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, AttachmentsResponse, AttachmentResponse, Attachment

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample_file_with_attachment.pdf"
        ATTACHMENT_PATH = ""

    class PdfAttachments:
        """Class for managing PDF attachments using Aspose PDF Cloud API."""
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """Initialize the API client."""
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """Upload a PDF document to the Aspose Cloud server."""
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def get_attachments(self):
            """Get attachments for the PDF document."""
            if self.pdf_api:
                try:
                    response : AttachmentsResponse = self.pdf_api.get_document_attachments(Config.PDF_DOCUMENT_NAME)
                    if response.code == 200:
                        logging.info(f"get_attachmnets(): attachments '{response.attachments}' for the document '{Config.PDF_DOCUMENT_NAME}'.")
                        Config.ATTACHMENT_PATH = response.attachments.list[0].links[0].href
                    else:
                        logging.error(f"get_attachmnets(): Failed to get attachments to the document. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"get_attachmnets(): Error while adding attachment: {e}")

        def get_attachment_by_id(self):
            """Get attachment by Id for the PDF document and save it to local file."""
            if self.pdf_api:
                try:
                    response : AttachmentResponse = self.pdf_api.get_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
                    if response.code == 200:
                        attachment: Attachment = response.attachment
                        temp_file = self.pdf_api.get_download_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
                        local_path = Config.LOCAL_FOLDER / attachment.name
                        shutil.copy(temp_file, local_path)
                        logging.info(f"get_attachment_by_id(): attachment '{local_path}' for the document '{Config.PDF_DOCUMENT_NAME}' successfuly saved.")
                    else:
                        logging.error(f"get_attachment_by_id(): Failed to get attachment for the document '{Config.PDF_DOCUMENT_NAME}'. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"get_attachment_by_id(): Error while get attachment: {e}")


    if __name__ == "__main__":
        pdf_attachments = PdfAttachments()
        pdf_attachments.upload_document()
        pdf_attachments.get_attachments()
        pdf_attachments.get_attachment_by_id()