Trích Xuất Tệp Đính Kèm Từ PDF Trong Python SDK
API để trích xuất tệp đính kèm trong tài liệu PDF với Aspose.PDF Cloud Python SDK
Get StartedCách trích xuất tệp đính kèm từ tài liệu PDF bằng Cloud Python SDK
Để làm việc với tệp đính kèm trong tài liệu PDF, chúng ta sẽ sử dụng Aspose.PDF Cloud Python SDK SDK Đám mây này hỗ trợ lập trình viên Python phát triển các ứng dụng tạo, chú thích, chỉnh sửa, và chuyển đổi PDF dựa trên đám mây bằng ngôn ngữ lập trình Python thông qua Aspose.PDF REST API. Mở NPM trình quản lý gói, tìm kiếm Aspose.PDF Cloud, và cài đặt. Bạn cũng có thể sử dụng lệnh sau từ Bảng điều khiển Quản lý Gói.
Cài đặt từ Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Lệnh Bảng Điều Khiển Quản Lý Gói
pip install asposepdfcloud
Các bước để nhận tệp đính kèm qua Python SDK
Các nhà phát triển Aspose.PDF Cloud Python có thể dễ dàng trích xuất tệp đính kèm từ tài liệu PDF. Các nhà phát triển chỉ cần một vài dòng mã.
- Tải thông tin Bí mật và Khóa Ứng dụng từ tệp JSON hoặc đặt thông tin xác thực theo cách khác
- Tạo một đối tượng để kết nối với API Đám mây
- Đặt tên với đường dẫn của tệp tài liệu của bạn
- Thực hiện các hành động trích xuất tệp đính kèm
- Phản hồi từ chức năng API Đám mây sẽ chứa danh sách tệp đính kèm
Yêu Cầu Hệ Thống
Dễ dàng bắt đầu với Aspose.PDF Cloud Python SDK và không cần cài đặt. Chỉ cần tạo tài khoản tại Aspose for Cloud và nhận thông tin ứng dụng của bạn. Khi bạn đã có App SID & khóa, bạn sẵn sàng sử dụng Aspose.PDF Cloud Python SDK.
- CPU: 1GHz
- RAM: 512Mb
- Dung lượng trống trên đĩa: 20Mb
- Hệ điều hành bất kỳ Microsoft Windows, Mac OS, Linux x32/x64
- Python v4.8 hoặc cao hơn
Mã mẫu này hiển thị cách trích xuất tất cả tệp đính kèm của tài liệu PDF sử dụng PDF Cloud Python SDK
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi, AttachmentsResponse, AttachmentResponse, Attachment
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class Config:
"""Configuration parameters."""
CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
LOCAL_FOLDER = Path(r"C:\Samples")
PDF_DOCUMENT_NAME = "sample_file_with_attachment.pdf"
ATTACHMENT_PATH = ""
class PdfAttachments:
"""Class for managing PDF attachments using Aspose PDF Cloud API."""
def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
self.pdf_api = None
self._init_api(credentials_file)
def _init_api(self, credentials_file: Path):
"""Initialize the API client."""
try:
with credentials_file.open("r", encoding="utf-8") as file:
credentials = json.load(file)
api_key, app_id = credentials.get("key"), credentials.get("id")
if not api_key or not app_id:
raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
self.pdf_api = PdfApi(ApiClient(api_key, app_id))
except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
logging.error(f"init_api(): Failed to load credentials: {e}")
def upload_document(self):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
try:
self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
except Exception as e:
logging.error(f"upload_document(): Failed to upload file: {e}")
def get_attachments(self):
"""Get attachments for the PDF document."""
if self.pdf_api:
try:
response : AttachmentsResponse = self.pdf_api.get_document_attachments(Config.PDF_DOCUMENT_NAME)
if response.code == 200:
logging.info(f"get_attachmnets(): attachments '{response.attachments}' for the document '{Config.PDF_DOCUMENT_NAME}'.")
Config.ATTACHMENT_PATH = response.attachments.list[0].links[0].href
else:
logging.error(f"get_attachmnets(): Failed to get attachments to the document. Response code: {response.code}")
except Exception as e:
logging.error(f"get_attachmnets(): Error while adding attachment: {e}")
def get_attachment_by_id(self):
"""Get attachment by Id for the PDF document and save it to local file."""
if self.pdf_api:
try:
response : AttachmentResponse = self.pdf_api.get_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
if response.code == 200:
attachment: Attachment = response.attachment
temp_file = self.pdf_api.get_download_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
local_path = Config.LOCAL_FOLDER / attachment.name
shutil.copy(temp_file, local_path)
logging.info(f"get_attachment_by_id(): attachment '{local_path}' for the document '{Config.PDF_DOCUMENT_NAME}' successfuly saved.")
else:
logging.error(f"get_attachment_by_id(): Failed to get attachment for the document '{Config.PDF_DOCUMENT_NAME}'. Response code: {response.code}")
except Exception as e:
logging.error(f"get_attachment_by_id(): Error while get attachment: {e}")
if __name__ == "__main__":
pdf_attachments = PdfAttachments()
pdf_attachments.upload_document()
pdf_attachments.get_attachments()
pdf_attachments.get_attachment_by_id()