Cloud Python SDKを使用してPDFからページを取得する方法
PDFからページを抽出するには、 Aspose.PDF Cloud Python SDK。このクラウドSDKは、Pythonプログラミング言語を使用してPythonプログラマーがCloudベースのPDF作成者、アノテーション、編集者、および変換アプリケーションを開発するのを助けます。Aspose.PDF REST APIを介して。まず、Aspose for Cloudでアカウントを作成し、アプリケーションエンティティ情報を取得します。アプリSID&キーを入手したら、Aspose.PDF Cloud Python SDKの準備が整います。PythonパッケージがGithubにホストされている場合は、Githubから直接インストールできます:
Githubからのインストール
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
パッケージマネージャーのコマンド
pip install asposepdfcloud
Python SDKを使用してPDFからページを取得する手順
Aspose.PDF Cloud開発者は、数行のコードでPDFからページを簡単に読み込み、抽出できます。
- Python SDKをインストール
- PDFドキュメントをAspose Cloudサーバーにアップロード
- Aspose Cloudサーバーから処理されたPDFドキュメントをダウンロード
- PDFドキュメントのページ情報を取得
Pythonを使用してPDFからページを抽出
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi, DocumentPagesResponse
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class Config:
"""Configuration parameters."""
CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
LOCAL_FOLDER = Path(r"C:\Samples")
PDF_DOCUMENT_NAME = "sample.pdf"
LOCAL_RESULT_DOCUMENT_NAME = "output_sample.png"
PAGE_NUMBER = 2
class PdfPages:
""" Class for managing PDF pages using Aspose PDF Cloud API. """
def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
self.pdf_api = None
self._init_api(credentials_file)
def _init_api(self, credentials_file: Path):
""" Initialize the API client. """
try:
with credentials_file.open("r", encoding="utf-8") as file:
credentials = json.load(file)
api_key, app_id = credentials.get("key"), credentials.get("id")
if not api_key or not app_id:
raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
self.pdf_api = PdfApi(ApiClient(api_key, app_id))
except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
logging.error(f"init_api(): Failed to load credentials: {e}")
def upload_document(self):
""" Upload a PDF document to the Aspose Cloud server. """
if self.pdf_api:
file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
try:
self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
except Exception as e:
logging.error(f"upload_document(): Failed to upload file: {e}")
def get_page_info(self):
""" Get page information of the PDF document. """
if self.pdf_api:
result_pages: DocumentPagesResponse = self.pdf_api.get_page(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
if result_pages.code == 200:
logging.info(f"Page #{Config.PAGE_NUMBER} information: {result_pages.page}")
else:
logging.error(f"Failed to get the page #{Config.PAGE_NUMBER}.")
def get_page_as_png(self):
""" Get page information of the PDF document. """
if self.pdf_api:
try:
result_pages = self.pdf_api.get_page_convert_to_png(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
shutil.move(result_pages, str(local_path))
logging.info(f"download_result(): File successfully downloaded: {local_path}")
except Exception as e:
logging.error(f"download_result(): Failed to download file: {e}")
if __name__ == "__main__":
pdf_pages = PdfPages()
pdf_pages.upload_document()
pdf_pages.get_page_info()
pdf_pages.get_page_as_png()
PDFでページを操作する
PDFからページを抽出することは、さまざまな文脈でさまざまな目的を果たすための一般的なタスクです。このプロセスには、大きなドキュメントから特定のページを選択して新しい別のPDFファイルを作成することが含まれます。この慣行で実際に起こっていることを理解することで、PDFドキュメントの管理と活用方法が効果的に理解できます。 大きなPDFファイルは共有や保管がたいへんです。必要なページだけを抽出することで、ユーザーは小さく、取り扱いやすいファイルを作成できます。これは、ドキュメントの一部が特定の目的にとって関連性がある場合に特に有用です。例えば、不要なページを削除することで、ファイルサイズを大幅に縮小し、取り扱いやすく、配布しやすくすることができます。 ページを抽出することで、ユーザーは異なるアプリケーションでコンテンツを再利用できます。例えば、誰かが包括的なレポートからページを抽出して、独自の概要を作成し、分析のために特定のデータを分離することができます。これにより、情報を再び最初から作成する必要なしに、既存のコンテンツを再利用できます。PDFドキュメントからページを抽出するには、Aspose.PDF Cloud Python SDKを使用します。
当社のPythonライブラリでは以下が可能です:
- PDFドキュメントを結合します。
- PDFファイルを分割します。
- PDFを他の形式に変換し、逆も同様です。
- アノテーションを操作します。
- PDFの画像を操作しますなど。
- 無料アプリを試して、機能をオンラインでテストできます。