HTML JPG PDF XML DOCX
  Product Family
PDF

通过 Python SDK 按 Id 提取解析 PDF 中的图像

使用服务器端 Python API 按 Id 提取解析 PDF 文档中的图像的 API。

Get Started

如何使用云端 Python SDK 按 Id 提取解析 PDF 文档中的图像

为了通过云端 Python SDK 按 Id 提取解析 PDF 文档中的图像,我们将使用 Aspose.PDF Cloud Python SDK 这个云端 SDK 帮助 Python 程序员使用 Aspose.PDF REST API 开发基于云的 PDF 创建、注释、编辑、转换和解析应用程序。只需在 Aspose for Cloud 创建一个帐户并获取您的应用信息。一旦您拥有 App SID 和密钥,就可以使用 Aspose.PDF Cloud Python SDK。如果 python 包托管在 Github 上,您可以直接从 Github 安装:

从 Github 安装


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
     

包管理器控制台命令

     
    pip install asposepdfcloud

使用 Python SDK 按 Id 提取解析 PDF 的步骤

Aspose.PDF Cloud 开发人员可以轻松地按 Id 提取解析 PDF 文档中的图像。开发人员只需几行代码。

  1. 使用您的应用程序密钥和密钥创建一个新的配置对象
  2. 创建一个对象以连接到云 API
  3. 上传您的文档文件
  4. 使用 get_image_extract_as_png 函数在云存储中按 Id 提取解析 PDF 文档中的图像
  5. 检查响应并记录结果
  6. 如有需要,将图像作为 PNG 文件下载到本地
 

此示例代码展示了按 Id 提取解析 PDF 文档中的图像


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractImage:
    """Class for extracting images from PDF document page using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def extract(self, documentName: str, imageId: str, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
        response = self.helper.pdf_api.get_image_extract_as_png(documentName, imageId, **opts)
        logging.info(f"ParseExtractImage(): Image '{imageId}' successfully extracted from the document '{documentName}'.")
        local_path = localFolder / ( imageId + '.png' )
        shutil.move(response, str(local_path))
 

通过 Python SDK 处理按 Id 提取解析 PDF 中的图像

通过按 Id 提取解析 PDF 文档中的图像,您可以根据需要下载或修改 PDF 中的图像。这保持了图像在文档中的位置,同时节省了时间并减少了手动工作。 使用 Aspose.PDF Cloud Python SDK 按 Id 提取解析 PDF 文档中的图像。

使用我们的 Python SDK,您可以

  • 以文本或图像格式添加 PDF 文档的页眉和页脚。
  • 向 PDF 文档添加表格和文本或图像印章。
  • 将多个 PDF 文档追加到现有文件。
  • 处理 PDF 附件、注释和表单字段。
  • 对 PDF 文档应用加密或解密并设置密码。
  • 从页面或整个 PDF 文档中删除所有印章和表格。
  • 根据 ID 从 PDF 文档中删除特定印章或表格。
  • 在 PDF 页面或整个文档中替换单个或多个文本实例。
  • 广泛支持将 PDF 文档转换为各种其他文件格式。
  • 提取 PDF 文件的各种元素并优化 PDF 文档。
  • 您可以试用我们的 免费应用 来测试功能。

  •