HTML JPG PDF XML DOCX
  Product Family
PDF

Анализ PDF для извлечения изображений в Python SDK

API для анализа PDF документов с целью извлечения изображений с использованием серверного API Python.

Get Started

Как анализировать PDF документы для извлечения изображений с использованием Cloud Python SDK

Для анализа PDF документов и извлечения изображений через Cloud Python SDK мы будем использовать Aspose.PDF Cloud Python SDK Этот Cloud SDK помогает программистам на Python разрабатывать облачные приложения для создания, аннотирования, редактирования, конвертации и анализа PDF с использованием Aspose.PDF REST API. Просто создайте учетную запись на Aspose for Cloud и получите информацию о своем приложении. Как только у вас будут SID и ключ приложения, вы готовы использовать Aspose.PDF Cloud Python SDK. Если пакет Python размещен на Github, вы можете установить его напрямую с Github:

Установка с Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
     
     

Шаги для анализа PDF для извлечения изображений с использованием Python SDK

Разработчики Aspose.PDF Cloud могут легко анализировать PDF документы для извлечения изображений. Разработчикам потребуется всего несколько строк кода.

  1. Создайте новый объект Configuration с вашим секретом приложения и ключом
  2. Создайте объект для подключения к Cloud API
  3. Загрузите файл документа
  4. Анализируйте PDF документы для извлечения изображений в облачном хранилище, используя функции get_images и get_image_extract_as_png
  5. Проверьте ответ и зарегистрируйте результат
  6. Скачайте изображения в формате PNG локально, если необходимо
 

Этот пример кода показывает анализ PDF документа для извлечения изображений


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractImages:
    """Class for extracting images from PDF document page using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def extract(self, documentName: str, pageNumber: int, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
        respImages = self.pdf_api.get_images(documentName, pageNumber, **opts)
        if respImages.code != 200:
            logging.error("ParseExtractImages(): Unexpected error!")
        else:
            for img in respImages.images.list:
                response = self.pdf_api.get_image_extract_as_png(documentName, img.id, **opts)

                logging.info(f"ParseExtractImages(): Image '{img.id}' successfully extracted from the document '{documentName}'.")
                local_path = localFolder / ( img.id + '.png' )
                shutil.move(response, str(local_path))
 

Работа с анализом изображений в PDF через Python SDK

Путем анализа PDF документов для извлечения изображений можно систематически проверять их действительность и актуальность, обеспечивая, что все ссылки актуальны и работают. Для задач, таких как загрузка связанных изображений или проведение пакетного анализа, извлечение изображений позволяет автоматизировать процессы, экономя время и снижая затраты ручного труда. Анализируйте PDF документы для извлечения изображений с помощью Aspose.PDF Cloud Python SDK.

С нашим Python SDK вы можете

  • Добавлять заголовки и колонтитулы в текстовом или графическом формате в PDF документы.
  • Добавлять таблицы и текстовые или графические штампы в PDF документы.
  • Присоединять несколько PDF документов к существующему файлу.
  • Работать с вложениями, аннотациями и полями форм в PDF.
  • Применять шифрование или дешифрование к PDF документам и устанавливать пароль.
  • Удалять все штампы и таблицы со страницы или всего PDF документа.
  • Удалять определенный штамп или таблицу из PDF документа по ID.
  • Заменять один или несколько экземпляров текста на странице PDF или во всем документе.
  • Обширная поддержка конверсии PDF документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF файлов и оптимизировать PDF документы.
  • Вы можете попробовать наше бесплатное приложение для тестирования функциональности.

  •