Cách xóa Bảng từ PDF qua Cloud Python SDK
Để xóa bảng từ PDF, chúng ta sẽ sử dụng Aspose.PDF Cloud Python SDK. Cloud SDK này hỗ trợ các lập trình viên Python trong việc phát triển các ứng dụng tạo, chú thích, chỉnh sửa và chuyển đổi PDF dựa trên đám mây bằng ngôn ngữ lập trình Python qua Aspose.PDF REST API. Chỉ cần tạo tài khoản tại Aspose for Cloud và lấy thông tin ứng dụng của bạn. Khi bạn đã có App SID & key, bạn đã sẵn sàng sử dụng Aspose.PDF Cloud Python SDK. Nếu gói python được lưu trữ trên Github, bạn có thể cài đặt trực tiếp từ Github:
Cài đặt từ Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Lệnh trong Package Manager Console
pip install asposepdfcloud
Các bước để xóa Bảng từ PDF qua Python
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng tải và xóa bảng từ PDF chỉ với vài dòng mã.
- Cài đặt Python SDK
- Tải lên tài liệu PDF lên máy chủ Aspose Cloud
- Tải xuống tài liệu PDF đã xử lý từ máy chủ Aspose Cloud
- Lấy tất cả các bảng
- Xóa bảng
Xóa Bảng từ PDF bằng Python
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi, Table, Row, Cell, FontStyles, GraphInfo, TextRect, TextState, Color, BorderInfo
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class Config:
"""Configuration parameters."""
CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
LOCAL_FOLDER = Path(r"C:\Samples")
PDF_DOCUMENT_NAME = "sample.pdf"
LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
PAGE_NUMBER = 1
TABLE_ID = "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA"
class PdfTables:
""" Class for managing PDF tables using Aspose PDF Cloud API. """
def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
self.pdf_api = None
self._init_api(credentials_file)
def _init_api(self, credentials_file: Path):
""" Initialize the API client. """
try:
with credentials_file.open("r", encoding="utf-8") as file:
credentials = json.load(file)
api_key, app_id = credentials.get("key"), credentials.get("id")
if not api_key or not app_id:
raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
self.pdf_api = PdfApi(ApiClient(api_key, app_id))
except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
logging.error(f"init_api(): Failed to load credentials: {e}")
def upload_document(self):
""" Upload a PDF document to the Aspose Cloud server. """
if self.pdf_api:
file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
try:
self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
except Exception as e:
logging.error(f"upload_document(): Failed to upload file: {e}")
def download_result(self):
""" Download the processed PDF document from the Aspose Cloud server. """
if self.pdf_api:
try:
temp_file = self.pdf_api.download_file(Config.PDF_DOCUMENT_NAME)
local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
shutil.move(temp_file, str(local_path))
logging.info(f"download_result(): File successfully downloaded: {local_path}")
except Exception as e:
logging.error(f"download_result(): Failed to download file: {e}")
def _show_tables_info(self, tables, prefix):
if tables and len(tables) > 0 :
for table in tables:
logging.info(f"{prefix} => id: '{table.id}', page: '{table.page_num}', rows: '{len(table.row_list)}', columns: '{len(table.row_list[0].cell_list)}'")
else:
logging.error(f"_show_tables_info() error: array of tables is empty!")
def get_all_tables(self, prefix):
if self.pdf_api:
resultTabs = self.pdf_api.get_document_tables(Config.PDF_DOCUMENT_NAME)
if resultTabs.code == 200 and resultTabs.tables:
if not resultTabs.tables.list or len(resultTabs.tables.list) == 0:
logging.error("get_all_tables(): Unexpected error - tables is null or empty!!!")
self._show_tables_info(resultTabs.tables.list, prefix)
else:
logging.error("get_all_tables(): Unexpected error - can't get links!!!")
def delete_table(self):
if self.pdf_api:
resultTabs = self.pdf_api.delete_table(Config.PDF_DOCUMENT_NAME, Config.TABLE_ID)
if resultTabs.code == 200:
logging.info(f"delete_table(): Table #{Config.TABLE_ID} deleted!")
else:
logging.error("delete_table(): Unexpected error - can't delete table!")
def delete_tables(self):
if self.pdf_api:
resultTabs = self.pdf_api.delete_page_tables(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
if resultTabs.code == 200:
logging.info(f"delete_tables(): Tables on page #{Config.PAGE_NUMBER} deleted!")
else:
logging.error("delete_tables(): Unexpected error - can't get tables!!!")
if __name__ == "__main__":
pdf_tables = PdfTables()
pdf_tables.upload_document()
pdf_tables.get_all_tables("All tables")
pdf_tables.delete_table()
pdf_tables.get_all_tables("Tables after drop one")
pdf_tables.delete_tables()
pdf_tables.get_all_tables("Tables after drop all")
pdf_tables.download_result()
Làm việc với Bảng trong PDF
Bảng cung cấp một định dạng có cấu trúc để trình bày dữ liệu một cách có hệ thống, giúp người đọc dễ dàng hiểu và phân tích thông tin. Chúng cũng tăng cường sự hấp dẫn trực quan của tài liệu, thêm tính chuyên nghiệp và tổ chức. Khi xử lý dữ liệu số hoặc so sánh, bảng cải thiện sự rõ ràng bằng cách nhóm thông tin liên quan trong một định dạng dễ đọc. Ngoài ra, bảng có thể tích hợp nội dung thời gian thực hoặc được tạo động, chẳng hạn như dữ liệu từ cơ sở dữ liệu hoặc bảng điều khiển phân tích. Xóa Bảng từ tài liệu PDF với Aspose.PDF Cloud Python SDK.
Với thư viện Python của chúng tôi, bạn có thể:
- Kết hợp tài liệu PDF.
- Tách tệp PDF.
- Chuyển đổi PDF sang các định dạng khác và ngược lại.
- Thao tác với Chú thích.
- Làm việc với Hình ảnh trong PDF, v.v.
- Bạn có thể thử ứng dụng miễn phí của chúng tôi để kiểm tra tính năng trực tuyến.