Phân tích PDF để trích xuất Hình ảnh trong Python SDK

API để phân tích tài liệu PDF để trích xuất hình ảnh sử dụng API Python phía máy chủ.

Get Started

NET PHP GO NODEJS

Cách phân tích tài liệu PDF để trích xuất Hình ảnh sử dụng Cloud Python SDK

Để phân tích tài liệu PDF để trích xuất Hình ảnh qua Cloud Python SDK, chúng ta sẽ sử dụng Aspose.PDF Cloud Python SDK Cloud SDK này hỗ trợ lập trình viên Python phát triển các ứng dụng tạo, chú thích, chỉnh sửa, chuyển đổi và phân tích PDF dựa trên đám mây sử dụng ngôn ngữ lập trình Python qua Aspose.PDF REST API. Chỉ cần tạo một tài khoản tại Aspose for Cloud và lấy thông tin ứng dụng của bạn. Khi bạn có App SID & key, bạn đã sẵn sàng sử dụng Aspose.PDF Cloud Python SDK. Nếu gói python được lưu trữ trên Github, bạn có thể cài đặt trực tiếp từ Github:

Cài đặt từ Github
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Các bước để phân tích PDF để trích xuất Hình ảnh sử dụng Python SDK

Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất Hình ảnh. Các nhà phát triển chỉ cần vài dòng mã.

Tạo một đối tượng Cấu hình mới với Bí mật và Khóa Ứng dụng của bạn
Tạo một đối tượng để kết nối với API Đám mây
Tải tệp tài liệu của bạn lên
Phân tích tài liệu PDF để trích xuất Hình ảnh trong lưu trữ đám mây sử dụng các hàm get_images và get_image_extract_as_png
Kiểm tra phản hồi và ghi lại kết quả
Tải xuống Hình ảnh dưới dạng tệp PNG cục bộ nếu cần

Đoạn mã mẫu này cho thấy cách phân tích tài liệu PDF để trích xuất Hình ảnh
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractImages:
    """Class for extracting images from PDF document page using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def extract(self, documentName: str, pageNumber: int, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
        respImages = self.pdf_api.get_images(documentName, pageNumber, **opts)
        if respImages.code != 200:
            logging.error("ParseExtractImages(): Unexpected error!")
        else:
            for img in respImages.images.list:
                response = self.pdf_api.get_image_extract_as_png(documentName, img.id, **opts)

                logging.info(f"ParseExtractImages(): Image '{img.id}' successfully extracted from the document '{documentName}'.")
                local_path = localFolder / ( img.id + '.png' )
                shutil.move(response, str(local_path))

Làm việc với việc phân tích Hình ảnh trong PDF qua Python SDK

Bằng cách phân tích tài liệu PDF để trích xuất hình ảnh, người dùng có thể kiểm tra có hệ thống tính hợp lệ và liên quan của từng hình ảnh, đảm bảo rằng tất cả các tham chiếu đều còn hiệu lực và hoạt động. Đối với các nhiệm vụ như tải xuống hình ảnh được liên kết hoặc thực hiện các phân tích hàng loạt, việc trích xuất hình ảnh cho phép tự động hóa, tiết kiệm thời gian và giảm nỗ lực thủ công. Phân tích tài liệu PDF để trích xuất hình ảnh với Aspose.PDF Cloud Python SDK.

Với Python SDK của chúng tôi, bạn có thể

Thêm tiêu đề & chân trang tài liệu PDF dưới dạng văn bản hoặc hình ảnh.
Thêm bảng & đóng dấu văn bản hoặc hình ảnh vào tài liệu PDF.
Thêm nhiều tài liệu PDF vào tệp hiện có.
Làm việc với tệp đính kèm, chú thích & trường biểu mẫu PDF.
Áp dụng mã hóa hoặc giải mã cho tài liệu PDF và đặt mật khẩu.
Xóa tất cả dấu và bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
Xóa một dấu hoặc bảng cụ thể khỏi tài liệu PDF theo ID của nó.
Thay thế một hoặc nhiều lần xuất hiện của văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
Hỗ trợ mở rộng cho việc chuyển đổi tài liệu PDF sang các định dạng tệp khác nhau.
Trích xuất các yếu tố khác nhau của tệp PDF và tối ưu hóa tài liệu PDF.
Bạn có thể dùng thử Ứng dụng miễn phí của chúng tôi để kiểm tra chức năng.

Tài nguyên Học tập
Tài liệu
Mã nguồn
Tham khảo API

Tại sao nên chọn Aspose.PDF Cloud cho Python?
Danh sách Khách hàng
Bảo mật

Phân tích PDF để trích xuất Hình ảnh trong Python SDK

API để phân tích tài liệu PDF để trích xuất hình ảnh sử dụng API Python phía máy chủ.

Aspose.PDF Cloud SDK cho Python

Overview

Cách phân tích tài liệu PDF để trích xuất Hình ảnh sử dụng Cloud Python SDK

Cài đặt từ Github

Các bước để phân tích PDF để trích xuất Hình ảnh sử dụng Python SDK

Đoạn mã mẫu này cho thấy cách phân tích tài liệu PDF để trích xuất Hình ảnh

Làm việc với việc phân tích Hình ảnh trong PDF qua Python SDK