HTML JPG PDF XML DOCX
  Product Family
PDF

Phân tích PDF để trích xuất Hình ảnh theo Id trong Python SDK

API để phân tích tài liệu PDF nhằm trích xuất hình ảnh theo Id bằng cách sử dụng server-side Python API.

Get Started

Cách phân tích tài liệu PDF để trích xuất Hình ảnh theo Id bằng Cloud Python SDK

Để phân tích tài liệu PDF nhằm trích xuất Hình ảnh theo Id qua Cloud Python SDK, chúng ta sẽ sử dụng Aspose.PDF Cloud Python SDK Cloud SDK này hỗ trợ các lập trình viên Python trong việc phát triển các ứng dụng tạo, chú thích, chỉnh sửa, chuyển đổi và phân tích PDF dựa trên đám mây bằng ngôn ngữ lập trình Python thông qua Aspose.PDF REST API. Đơn giản chỉ cần tạo một tài khoản tại Aspose for Cloud và nhận thông tin ứng dụng của bạn. Khi bạn có App SID & key, bạn đã sẵn sàng để sử dụng Aspose.PDF Cloud Python SDK. Nếu gói python được lưu trữ trên Github, bạn có thể cài đặt trực tiếp từ Github:

Cài đặt từ Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
     

Lệnh Console của Trình quản lý gói

     
    pip install asposepdfcloud

Các bước để phân tích PDF để trích xuất Hình ảnh theo Id bằng Python SDK

Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất Hình ảnh theo Id. Các nhà phát triển chỉ cần vài dòng mã.

  1. Tạo đối tượng Cấu hình mới với Bí mật và Khóa Ứng dụng của bạn
  2. Tạo đối tượng để kết nối với API Đám mây
  3. Tải lên tệp tài liệu của bạn
  4. Phân tích tài liệu PDF để trích xuất Hình ảnh theo Id trong lưu trữ đám mây bằng cách sử dụng hàm get_image_extract_as_png
  5. Kiểm tra phản hồi và ghi lại kết quả
  6. Tải Hình ảnh dưới dạng tệp PNG xuống máy cục bộ nếu cần
 

Mã ví dụ này cho thấy phân tích tài liệu PDF để trích xuất Hình ảnh theo Id


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractImage:
    """Class for extracting images from PDF document page using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def extract(self, documentName: str, imageId: str, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
        response = self.helper.pdf_api.get_image_extract_as_png(documentName, imageId, **opts)
        logging.info(f"ParseExtractImage(): Image '{imageId}' successfully extracted from the document '{documentName}'.")
        local_path = localFolder / ( imageId + '.png' )
        shutil.move(response, str(local_path))
 

Làm việc với phân tích Hình ảnh theo Id trong PDF qua Python SDK

Bằng cách phân tích tài liệu PDF để trích xuất hình ảnh theo Id, bạn có thể tải xuống hoặc chỉnh sửa hình ảnh trong PDF nếu cần. Điều này duy trì vị trí của hình ảnh trong tài liệu trong khi tiết kiệm thời gian và giảm bớt công việc thủ công. Phân tích tài liệu PDF để trích xuất hình ảnh theo Id với Aspose.PDF Cloud Python SDK.

Với Python SDK của chúng tôi, bạn có thể

  • Thêm tiêu đề & chân trang của tài liệu PDF dưới dạng văn bản hoặc hình ảnh.
  • Thêm bảng & tem văn bản hoặc hình ảnh vào tài liệu PDF.
  • Nối nhiều tài liệu PDF vào một tệp hiện có.
  • Làm việc với các tệp đính kèm, chú thích & trường biểu mẫu của PDF.
  • Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
  • Xóa tất cả tem & bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
  • Xóa một tem hoặc bảng cụ thể khỏi tài liệu PDF theo ID của nó.
  • Thay thế một hoặc nhiều lần xuất hiện của văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
  • Hỗ trợ rộng rãi cho việc chuyển đổi tài liệu PDF sang các định dạng tệp khác nhau.
  • Trích xuất các yếu tố khác nhau của tệp PDF & tối ưu hóa tài liệu PDF.
  • Bạn có thể thử Ứng dụng miễn phí của chúng tôi để kiểm tra chức năng.

  •