HTML JPG PDF XML DOCX
  Product Family
PDF

Python SDKでPDFから添付ファイルを抽出

Aspose.PDF Cloud Python SDKでPDFドキュメントの添付ファイルを抽出するためのAPI

Get Started

Cloud Python SDKを使用してPDFドキュメントから添付ファイルを抽出する方法

PDFドキュメントの添付ファイルを操作するために、次を使用します Aspose.PDF Cloud Python SDK このCloud SDKは、PythonプログラマーがAspose.PDF REST APIを介してPythonプログラミング言語を使用してクラウドベースのPDF作成、注釈付け、編集、変換アプリを開発するのを支援します。開く NPM パッケージマネージャーを開き、 Aspose.PDF Cloudを検索して、 インストールします。パッケージマネージャーコンソールから次のコマンドを使用することもできます。

Githubからのインストール


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

パッケージマネージャーコンソールのコマンド

     
    pip install asposepdfcloud

Python SDKで添付ファイルを取得する手順

Aspose.PDF Cloud Python開発者は、PDFドキュメントから簡単に添付ファイルを抽出できます。開発者は数行のコードだけで済みます。

  1. JSONファイルからアプリケーションシークレットとキーを読み込むか、別の方法で認証情報を設定
  2. Cloud APIに接続するためのオブジェクトを作成
  3. ドキュメントファイルの名前とパスを設定
  4. 添付ファイル抽出アクションを実行
  5. Cloud API関数からのレスポンスには添付ファイルリストが含まれます

システム要件

Aspose.PDF Cloud Python SDKを使い始めるのは簡単で、インストールするものはありません。Aspose for Cloudでアカウントを作成し、アプリケーション情報を取得してください。App SIDとキーを手に入れたら、Aspose.PDF Cloud Python SDKを試す準備が整います。

  • CPU: 1GHz
  • RAM: 512Mb
  • ディスク上の空き容量: 20Mb
  • 任意のOS Microsoft Windows, Mac OS, Linux x32/x64
  • Python v4.8以上

 

このサンプルコードは、PDF Cloud Python SDKを使用してPDFドキュメントのすべての添付ファイルを抽出する方法を示しています


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, AttachmentsResponse, AttachmentResponse, Attachment

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample_file_with_attachment.pdf"
        ATTACHMENT_PATH = ""

    class PdfAttachments:
        """Class for managing PDF attachments using Aspose PDF Cloud API."""
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """Initialize the API client."""
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """Upload a PDF document to the Aspose Cloud server."""
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def get_attachments(self):
            """Get attachments for the PDF document."""
            if self.pdf_api:
                try:
                    response : AttachmentsResponse = self.pdf_api.get_document_attachments(Config.PDF_DOCUMENT_NAME)
                    if response.code == 200:
                        logging.info(f"get_attachmnets(): attachments '{response.attachments}' for the document '{Config.PDF_DOCUMENT_NAME}'.")
                        Config.ATTACHMENT_PATH = response.attachments.list[0].links[0].href
                    else:
                        logging.error(f"get_attachmnets(): Failed to get attachments to the document. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"get_attachmnets(): Error while adding attachment: {e}")

        def get_attachment_by_id(self):
            """Get attachment by Id for the PDF document and save it to local file."""
            if self.pdf_api:
                try:
                    response : AttachmentResponse = self.pdf_api.get_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
                    if response.code == 200:
                        attachment: Attachment = response.attachment
                        temp_file = self.pdf_api.get_download_document_attachment_by_index(Config.PDF_DOCUMENT_NAME, Config.ATTACHMENT_PATH)
                        local_path = Config.LOCAL_FOLDER / attachment.name
                        shutil.copy(temp_file, local_path)
                        logging.info(f"get_attachment_by_id(): attachment '{local_path}' for the document '{Config.PDF_DOCUMENT_NAME}' successfuly saved.")
                    else:
                        logging.error(f"get_attachment_by_id(): Failed to get attachment for the document '{Config.PDF_DOCUMENT_NAME}'. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"get_attachment_by_id(): Error while get attachment: {e}")


    if __name__ == "__main__":
        pdf_attachments = PdfAttachments()
        pdf_attachments.upload_document()
        pdf_attachments.get_attachments()
        pdf_attachments.get_attachment_by_id()