Удалить таблицу из PDF в Python SDK
Удалите таблицы из PDF-документа с использованием Cloud Python SDK.
Get StartedКак удалить таблицы из PDF через Cloud Python SDK
Чтобы удалить таблицы из PDF, мы будем использовать Aspose.PDF Cloud Python SDK. Этот Cloud SDK помогает Python-программистам разрабатывать облачные приложения для создания, аннотирования, редактирования и преобразования PDF с использованием языка программирования Python через Aspose.PDF REST API. Просто создайте учетную запись на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас будет App SID и ключ, вы готовы использовать Aspose.PDF Cloud Python SDK. Если пакет python размещен на Github, вы можете установить его напрямую с Github:
Установка с Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Команда консоли диспетчера пакетов
pip install asposepdfcloud
Шаги для удаления таблиц из PDF через Python
Разработчики Aspose.PDF Cloud могут легко загружать и удалять таблицы из PDF всего за несколько строк кода.
- Установите Python SDK
- Загрузите PDF-документ на сервер Aspose Cloud
- Скачайте обработанный PDF-документ с сервера Aspose Cloud
- Получите все таблицы
- Удалите таблицы
Удаление таблиц из PDF с использованием Python
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi, Table, Row, Cell, FontStyles, GraphInfo, TextRect, TextState, Color, BorderInfo
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class Config:
"""Configuration parameters."""
CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
LOCAL_FOLDER = Path(r"C:\Samples")
PDF_DOCUMENT_NAME = "sample.pdf"
LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
PAGE_NUMBER = 1
TABLE_ID = "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA"
class PdfTables:
""" Class for managing PDF tables using Aspose PDF Cloud API. """
def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
self.pdf_api = None
self._init_api(credentials_file)
def _init_api(self, credentials_file: Path):
""" Initialize the API client. """
try:
with credentials_file.open("r", encoding="utf-8") as file:
credentials = json.load(file)
api_key, app_id = credentials.get("key"), credentials.get("id")
if not api_key or not app_id:
raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
self.pdf_api = PdfApi(ApiClient(api_key, app_id))
except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
logging.error(f"init_api(): Failed to load credentials: {e}")
def upload_document(self):
""" Upload a PDF document to the Aspose Cloud server. """
if self.pdf_api:
file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
try:
self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
except Exception as e:
logging.error(f"upload_document(): Failed to upload file: {e}")
def download_result(self):
""" Download the processed PDF document from the Aspose Cloud server. """
if self.pdf_api:
try:
temp_file = self.pdf_api.download_file(Config.PDF_DOCUMENT_NAME)
local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
shutil.move(temp_file, str(local_path))
logging.info(f"download_result(): File successfully downloaded: {local_path}")
except Exception as e:
logging.error(f"download_result(): Failed to download file: {e}")
def _show_tables_info(self, tables, prefix):
if tables and len(tables) > 0 :
for table in tables:
logging.info(f"{prefix} => id: '{table.id}', page: '{table.page_num}', rows: '{len(table.row_list)}', columns: '{len(table.row_list[0].cell_list)}'")
else:
logging.error(f"_show_tables_info() error: array of tables is empty!")
def get_all_tables(self, prefix):
if self.pdf_api:
resultTabs = self.pdf_api.get_document_tables(Config.PDF_DOCUMENT_NAME)
if resultTabs.code == 200 and resultTabs.tables:
if not resultTabs.tables.list or len(resultTabs.tables.list) == 0:
logging.error("get_all_tables(): Unexpected error - tables is null or empty!!!")
self._show_tables_info(resultTabs.tables.list, prefix)
else:
logging.error("get_all_tables(): Unexpected error - can't get links!!!")
def delete_table(self):
if self.pdf_api:
resultTabs = self.pdf_api.delete_table(Config.PDF_DOCUMENT_NAME, Config.TABLE_ID)
if resultTabs.code == 200:
logging.info(f"delete_table(): Table #{Config.TABLE_ID} deleted!")
else:
logging.error("delete_table(): Unexpected error - can't delete table!")
def delete_tables(self):
if self.pdf_api:
resultTabs = self.pdf_api.delete_page_tables(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
if resultTabs.code == 200:
logging.info(f"delete_tables(): Tables on page #{Config.PAGE_NUMBER} deleted!")
else:
logging.error("delete_tables(): Unexpected error - can't get tables!!!")
if __name__ == "__main__":
pdf_tables = PdfTables()
pdf_tables.upload_document()
pdf_tables.get_all_tables("All tables")
pdf_tables.delete_table()
pdf_tables.get_all_tables("Tables after drop one")
pdf_tables.delete_tables()
pdf_tables.get_all_tables("Tables after drop all")
pdf_tables.download_result()
Работа с таблицами в PDF
Таблицы предоставляют структурированный формат для систематического представления данных, облегчая читателям понимание и анализ информации. Они также улучшают визуальную привлекательность документа, добавляя профессионализм и организованность. При работе с числовыми или сравнительными данными таблицы улучшают ясность, группируя связанную информацию в удобочитаемый формат. Кроме того, таблицы могут включать данные в реальном времени или динамически генерируемый контент, такой как данные из баз данных или аналитических панелей. Удалите таблицу из PDF-документов с помощью Aspose.PDF Cloud Python SDK.
С нашей библиотекой Python вы можете:
- Объединять PDF-документы.
- Разделять PDF-файлы.
- Преобразовывать PDF в другие форматы и наоборот.
- Работать с аннотациями.
- Работать с изображениями в PDF и т.д.
- Вы можете попробовать наше бесплатное приложение для тестирования функциональности онлайн.