PNG JPG BMP TIFF PDF
Aspose.PDF  for Python

通过 Python SDK 提取 PDF 页面

使用 Cloud 使用 Cloud Python SDK 提取 PDF 文档页面。

Get Started

通过 Cloud Python SDK 提取 PDF 页面

要提取 PDF 页面,我们将使用 Aspose.PDF Cloud Python SDK。该 Cloud SDK 帮助 Python 程序员使用 Python 编程语言通过 Aspose.PDF REST API 开发基于云的 PDF 创建器、注释器、编辑器和转换器应用程序。只需在 Aspose for Cloud 创建一个账户并获取应用程序信息。获取 App SID 和密钥后,即可使用 Aspose.PDF Cloud Python SDK。如果 Python 包托管在 Github 上,可以直接从 Github 安装:

从 Github 安装


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

包管理器控制台命令

     
    pip install asposepdfcloud

通过 Python SDK 提取 PDF 页面的步骤

Aspose.PDF Cloud 开发者可以轻松加载并提取 PDF 页面,只需几行代码即可。

  1. 安装 Python SDK
  2. 将 PDF 文档上传到 Aspose Cloud 服务器
  3. 从 Aspose Cloud 服务器下载处理后的 PDF 文档
  4. 获取 PDF 文档的页面信息
 

使用 Python 提取 PDF 页面


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, DocumentPagesResponse

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.png"
        PAGE_NUMBER = 2

    class PdfPages:
        """ Class for managing PDF pages using Aspose PDF Cloud API. """
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """ Initialize the API client. """
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """ Upload a PDF document to the Aspose Cloud server. """
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def get_page_info(self):
            """ Get page information of the PDF document. """
            if self.pdf_api:
                result_pages: DocumentPagesResponse = self.pdf_api.get_page(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)

                if result_pages.code == 200:
                    logging.info(f"Page #{Config.PAGE_NUMBER} information: {result_pages.page}")
                else:
                    logging.error(f"Failed to get the page #{Config.PAGE_NUMBER}.")

        def get_page_as_png(self):
            """ Get page information of the PDF document. """
            if self.pdf_api:
                try:
                    result_pages = self.pdf_api.get_page_convert_to_png(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
                    local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
                    shutil.move(result_pages, str(local_path))
                    logging.info(f"download_result(): File successfully downloaded: {local_path}")
                except Exception as e:
                    logging.error(f"download_result(): Failed to download file: {e}")

    if __name__ == "__main__":
        pdf_pages = PdfPages()
        pdf_pages.upload_document()
        pdf_pages.get_page_info()
        pdf_pages.get_page_as_png()
 

在 PDF 中处理页面

从 PDF 中提取页面是一个常见任务,在不同的上下文中具有各种目的。该过程涉及从较大文档中选择特定页面以创建一个新的独立 PDF 文件。了解此做法的原因可以帮助有效管理和使用 PDF 文档。 大 PDF 文件可能难以共享或存储。通过仅提取必要页面,用户可以创建较小、更易管理的文件。当文档的某一部分对特定目的具有相关性时,这尤为有用。例如,删除不必要的页面可以显著减少文件大小,使其更易于处理和分发。 ​ 提取页面使用户可以将内容用于不同的应用程序。例如,某人可能会从详细报告中提取页面以创建独立的摘要,或者隔离特定数据进行分析。这使得在不必从头开始重新创建信息的情况下复用现有内容成为可能。使用 Aspose.PDF Cloud Python SDK 从 PDF 文档中提取页面。

使用我们的 Python 库可以:

  • 合并 PDF 文档。 +拆分 PDF 文件。
  • 将 PDF 转换为其他格式,反之亦然。
  • 处理注释。
  • 处理 PDF 中的图像等。
  • 您可以尝试我们的 免费应用 以在线测试功能。