PNG JPG BMP TIFF PDF
Aspose.PDF  for Python

Удалить таблицу из PDF в Python SDK

Удалите таблицы из PDF-документа с использованием Cloud Python SDK.

Get Started

Как удалить таблицы из PDF через Cloud Python SDK

Чтобы удалить таблицы из PDF, мы будем использовать Aspose.PDF Cloud Python SDK. Этот Cloud SDK помогает Python-программистам разрабатывать облачные приложения для создания, аннотирования, редактирования и преобразования PDF с использованием языка программирования Python через Aspose.PDF REST API. Просто создайте учетную запись на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас будет App SID и ключ, вы готовы использовать Aspose.PDF Cloud Python SDK. Если пакет python размещен на Github, вы можете установить его напрямую с Github:

Установка с Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Команда консоли диспетчера пакетов

     
    pip install asposepdfcloud

Шаги для удаления таблиц из PDF через Python

Разработчики Aspose.PDF Cloud могут легко загружать и удалять таблицы из PDF всего за несколько строк кода.

  1. Установите Python SDK
  2. Загрузите PDF-документ на сервер Aspose Cloud
  3. Скачайте обработанный PDF-документ с сервера Aspose Cloud
  4. Получите все таблицы
  5. Удалите таблицы
 

Удаление таблиц из PDF с использованием Python


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, Table, Row, Cell, FontStyles, GraphInfo, TextRect, TextState, Color, BorderInfo
    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
        PAGE_NUMBER = 1
        TABLE_ID = "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA"

    class PdfTables:
        """ Class for managing PDF tables using Aspose PDF Cloud API. """
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """ Initialize the API client. """
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """ Upload a PDF document to the Aspose Cloud server. """
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def download_result(self):
            """ Download the processed PDF document from the Aspose Cloud server. """
            if self.pdf_api:
                try:
                    temp_file = self.pdf_api.download_file(Config.PDF_DOCUMENT_NAME)
                    local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
                    shutil.move(temp_file, str(local_path))
                    logging.info(f"download_result(): File successfully downloaded: {local_path}")
                except Exception as e:
                    logging.error(f"download_result(): Failed to download file: {e}")


        def _show_tables_info(self, tables, prefix):
            if tables and len(tables) > 0 :
                for table in tables:
                    logging.info(f"{prefix} => id: '{table.id}', page: '{table.page_num}', rows: '{len(table.row_list)}', columns: '{len(table.row_list[0].cell_list)}'")
            else:
                logging.error(f"_show_tables_info() error: array of tables is empty!")

        def get_all_tables(self, prefix):
            if self.pdf_api:
                resultTabs = self.pdf_api.get_document_tables(Config.PDF_DOCUMENT_NAME)

                if resultTabs.code == 200 and resultTabs.tables:
                    if not resultTabs.tables.list or len(resultTabs.tables.list) == 0:
                        logging.error("get_all_tables(): Unexpected error - tables is null or empty!!!")
                    self._show_tables_info(resultTabs.tables.list, prefix)
                else:
                    logging.error("get_all_tables(): Unexpected error - can't get links!!!")

        def delete_table(self):
            if self.pdf_api:
                resultTabs = self.pdf_api.delete_table(Config.PDF_DOCUMENT_NAME, Config.TABLE_ID)
                if resultTabs.code == 200:
                    logging.info(f"delete_table(): Table #{Config.TABLE_ID} deleted!")
                else:
                    logging.error("delete_table(): Unexpected error - can't delete table!")

        def delete_tables(self):
            if self.pdf_api:
                resultTabs = self.pdf_api.delete_page_tables(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)

                if resultTabs.code == 200:
                    logging.info(f"delete_tables(): Tables on page #{Config.PAGE_NUMBER} deleted!")
                else:
                    logging.error("delete_tables(): Unexpected error - can't get tables!!!")

    if __name__ == "__main__":
        pdf_tables = PdfTables()
        pdf_tables.upload_document()

        pdf_tables.get_all_tables("All tables")
        pdf_tables.delete_table()
        pdf_tables.get_all_tables("Tables after drop one")

        pdf_tables.delete_tables()
        pdf_tables.get_all_tables("Tables after drop all")

        pdf_tables.download_result()
 

Работа с таблицами в PDF

Таблицы предоставляют структурированный формат для систематического представления данных, облегчая читателям понимание и анализ информации. Они также улучшают визуальную привлекательность документа, добавляя профессионализм и организованность. При работе с числовыми или сравнительными данными таблицы улучшают ясность, группируя связанную информацию в удобочитаемый формат. Кроме того, таблицы могут включать данные в реальном времени или динамически генерируемый контент, такой как данные из баз данных или аналитических панелей. Удалите таблицу из PDF-документов с помощью Aspose.PDF Cloud Python SDK.

С нашей библиотекой Python вы можете:

  • Объединять PDF-документы.
  • Разделять PDF-файлы.
  • Преобразовывать PDF в другие форматы и наоборот.
  • Работать с аннотациями.
  • Работать с изображениями в PDF и т.д.
  • Вы можете попробовать наше бесплатное приложение для тестирования функциональности онлайн.