PNG JPG BMP TIFF PDF
Aspose.PDF  for Python

Python SDKでPDFからページを抽出

Cloud を使用してCloud Python SDKを使用してPDFドキュメントからページを抽出

Get Started

Cloud Python SDKを使用してPDFからページを取得する方法

PDFからページを抽出するには、 Aspose.PDF Cloud Python SDK。このクラウドSDKは、Pythonプログラミング言語を使用してPythonプログラマーがCloudベースのPDF作成者、アノテーション、編集者、および変換アプリケーションを開発するのを助けます。Aspose.PDF REST APIを介して。まず、Aspose for Cloudでアカウントを作成し、アプリケーションエンティティ情報を取得します。アプリSID&キーを入手したら、Aspose.PDF Cloud Python SDKの準備が整います。PythonパッケージがGithubにホストされている場合は、Githubから直接インストールできます:

Githubからのインストール


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

パッケージマネージャーのコマンド

     
    pip install asposepdfcloud

Python SDKを使用してPDFからページを取得する手順

Aspose.PDF Cloud開発者は、数行のコードでPDFからページを簡単に読み込み、抽出できます。

  1. Python SDKをインストール
  2. PDFドキュメントをAspose Cloudサーバーにアップロード
  3. Aspose Cloudサーバーから処理されたPDFドキュメントをダウンロード
  4. PDFドキュメントのページ情報を取得
 

Pythonを使用してPDFからページを抽出


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, DocumentPagesResponse

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.png"
        PAGE_NUMBER = 2

    class PdfPages:
        """ Class for managing PDF pages using Aspose PDF Cloud API. """
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """ Initialize the API client. """
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """ Upload a PDF document to the Aspose Cloud server. """
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def get_page_info(self):
            """ Get page information of the PDF document. """
            if self.pdf_api:
                result_pages: DocumentPagesResponse = self.pdf_api.get_page(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)

                if result_pages.code == 200:
                    logging.info(f"Page #{Config.PAGE_NUMBER} information: {result_pages.page}")
                else:
                    logging.error(f"Failed to get the page #{Config.PAGE_NUMBER}.")

        def get_page_as_png(self):
            """ Get page information of the PDF document. """
            if self.pdf_api:
                try:
                    result_pages = self.pdf_api.get_page_convert_to_png(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
                    local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
                    shutil.move(result_pages, str(local_path))
                    logging.info(f"download_result(): File successfully downloaded: {local_path}")
                except Exception as e:
                    logging.error(f"download_result(): Failed to download file: {e}")

    if __name__ == "__main__":
        pdf_pages = PdfPages()
        pdf_pages.upload_document()
        pdf_pages.get_page_info()
        pdf_pages.get_page_as_png()
 

PDFでページを操作する

PDFからページを抽出することは、さまざまな文脈でさまざまな目的を果たすための一般的なタスクです。このプロセスには、大きなドキュメントから特定のページを選択して新しい別のPDFファイルを作成することが含まれます。この慣行で実際に起こっていることを理解することで、PDFドキュメントの管理と活用方法が効果的に理解できます。​ 大きなPDFファイルは共有や保管がたいへんです。必要なページだけを抽出することで、ユーザーは小さく、取り扱いやすいファイルを作成できます。これは、ドキュメントの一部が特定の目的にとって関連性がある場合に特に有用です。例えば、不要なページを削除することで、ファイルサイズを大幅に縮小し、取り扱いやすく、配布しやすくすることができます。 ​ ページを抽出することで、ユーザーは異なるアプリケーションでコンテンツを再利用できます。例えば、誰かが包括的なレポートからページを抽出して、独自の概要を作成し、分析のために特定のデータを分離することができます。これにより、情報を再び最初から作成する必要なしに、既存のコンテンツを再利用できます。PDFドキュメントからページを抽出するには、Aspose.PDF Cloud Python SDKを使用します。

当社のPythonライブラリでは以下が可能です:

  • PDFドキュメントを結合します。
  • PDFファイルを分割します。
  • PDFを他の形式に変換し、逆も同様です。
  • アノテーションを操作します。
  • PDFの画像を操作しますなど。
  • 無料アプリを試して、機能をオンラインでテストできます。