HTML
JPG
PDF
XML
DOCX
PDF
Cloud Python SDKを使用してPDFドキュメントから添付ファイルを抽出する方法
PDFドキュメントの添付ファイルを操作するために、次を使用します Aspose.PDF Cloud Python SDK このCloud SDKは、PythonプログラマーがAspose.PDF REST APIを介してPythonプログラミング言語を使用してクラウドベースのPDF作成、注釈付け、編集、変換アプリを開発するのを支援します。開く NPM パッケージマネージャーを開き、 Aspose.PDF Cloudを検索して、 インストールします。パッケージマネージャーコンソールから次のコマンドを使用することもできます。
Githubからのインストール
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
パッケージマネージャーコンソールのコマンド
pip install asposepdfcloud
Python SDKで添付ファイルを取得する手順
Aspose.PDF Cloud Python開発者は、PDFドキュメントから簡単に添付ファイルを抽出できます。開発者は数行のコードだけで済みます。
- JSONファイルからアプリケーションシークレットとキーを読み込むか、別の方法で認証情報を設定
- Cloud APIに接続するためのオブジェクトを作成
- ドキュメントファイルの名前とパスを設定
- 添付ファイル抽出アクションを実行
- Cloud API関数からのレスポンスには添付ファイルリストが含まれます
システム要件
Aspose.PDF Cloud Python SDKを使い始めるのは簡単で、インストールするものはありません。Aspose for Cloudでアカウントを作成し、アプリケーション情報を取得してください。App SIDとキーを手に入れたら、Aspose.PDF Cloud Python SDKを試す準備が整います。
- CPU: 1GHz
- RAM: 512Mb
- ディスク上の空き容量: 20Mb
- 任意のOS Microsoft Windows, Mac OS, Linux x32/x64
- Python v4.8以上
このサンプルコードは、PDF Cloud Python SDKを使用してPDFドキュメントのすべての添付ファイルを抽出する方法を示しています
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi, AttachmentsResponse, AttachmentResponse, Attachment
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class Config:
"""Configuration parameters."""
CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
LOCAL_FOLDER = Path(r"C:\Samples")
PDF_DOCUMENT_NAME = "sample_file_with_attachment.pdf"
ATTACHMENT_PATH = ""
class PdfAttachments:
"""Class for managing PDF attachments using Aspose PDF Cloud API."""
def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
self.pdf_api = None
self._init_api(credentials_file)
def _init_api(self, credentials_file: Path):
"""Initialize the API client."""
try:
with credentials_file.open("r", encoding="utf-8") as file:
credentials = json.load(file)
api_key, app_id = credentials.get("key"), credentials.get("id")
if not api_key or not app_id:
raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
self.pdf_api = PdfApi(ApiClient(api_key, app_id))
except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
logging.error(f"init_api(): Failed to load credentials: {e}")
def upload_document(self):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
try:
self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
except Exception as e:
logging.error(f"upload_document(): Failed to upload file: {e}")
def get_attachments(self):
"""Get attachments for the PDF document."""
if self.pdf_api:
try:
response : AttachmentsResponse = self.pdf_api.get_document_attachments(Config.PDF_DOCUMENT_NAME)
if response.code == 200:
logging.info(f"get_attachmnets(): attachments '{response.attachments}' for the document '{Config.PDF_DOCUMENT_NAME}'.")
Config.ATTACHMENT_PATH = response.attachments.list[0].links[0].href
else:
logging.error(f"get_attachmnets(): Failed to get attachments to the document. Response code: {response.code}")
except Exception as e:
logging.error(f"get_attachmnets(): Error while adding attachment: {e}")
def get_attachment_by_id(self):
"""Get attachment by Id for the PDF document and save it to local file."""
if self.pdf_api:
try:
response : AttachmentResponse = self.pdf_api.get_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
if response.code == 200:
attachment: Attachment = response.attachment
temp_file = self.pdf_api.get_download_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
local_path = Config.LOCAL_FOLDER / attachment.name
shutil.copy(temp_file, local_path)
logging.info(f"get_attachment_by_id(): attachment '{local_path}' for the document '{Config.PDF_DOCUMENT_NAME}' successfuly saved.")
else:
logging.error(f"get_attachment_by_id(): Failed to get attachment for the document '{Config.PDF_DOCUMENT_NAME}'. Response code: {response.code}")
except Exception as e:
logging.error(f"get_attachment_by_id(): Error while get attachment: {e}")
if __name__ == "__main__":
pdf_attachments = PdfAttachments()
pdf_attachments.upload_document()
pdf_attachments.get_attachments()
pdf_attachments.get_attachment_by_id()