PNG JPG BMP TIFF PDF
Aspose.PDF  for Python

通过 Python SDK 从 PDF 中删除表格

使用云 Python SDK 从 PDF 文档中删除表格。

Get Started

如何通过云 Python SDK 从 PDF 中删除表格

要从 PDF 中删除表格,我们将使用 Aspose.PDF Cloud Python SDK。此云 SDK 帮助 Python 程序员使用 Python 编程语言通过 Aspose.PDF REST API 开发基于云的 PDF 创建、注释、编辑和转换应用程序。只需在 Aspose for Cloud 创建一个账户并获取您的应用程序信息。一旦获得 App SID 和密钥,即可准备好使用 Aspose.PDF Cloud Python SDK。如果 Python 包托管在 Github 上,可以直接从 Github 安装:

从 Github 安装


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

包管理器控制台命令

     
    pip install asposepdfcloud

通过 Python 删除 PDF 中的表格步骤

Aspose.PDF Cloud 开发人员可以轻松地通过几行代码加载并删除 PDF 中的表格。

  1. 安装 Python SDK
  2. 将 PDF 文档上传到 Aspose Cloud 服务器
  3. 从 Aspose Cloud 服务器下载处理后的 PDF 文档
  4. 获取所有表格
  5. 删除表格
 

使用 Python 删除 PDF 中的表格


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, Table, Row, Cell, FontStyles, GraphInfo, TextRect, TextState, Color, BorderInfo
    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
        PAGE_NUMBER = 1
        TABLE_ID = "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA"

    class PdfTables:
        """ Class for managing PDF tables using Aspose PDF Cloud API. """
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """ Initialize the API client. """
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """ Upload a PDF document to the Aspose Cloud server. """
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def download_result(self):
            """ Download the processed PDF document from the Aspose Cloud server. """
            if self.pdf_api:
                try:
                    temp_file = self.pdf_api.download_file(Config.PDF_DOCUMENT_NAME)
                    local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
                    shutil.move(temp_file, str(local_path))
                    logging.info(f"download_result(): File successfully downloaded: {local_path}")
                except Exception as e:
                    logging.error(f"download_result(): Failed to download file: {e}")


        def _show_tables_info(self, tables, prefix):
            if tables and len(tables) > 0 :
                for table in tables:
                    logging.info(f"{prefix} => id: '{table.id}', page: '{table.page_num}', rows: '{len(table.row_list)}', columns: '{len(table.row_list[0].cell_list)}'")
            else:
                logging.error(f"_show_tables_info() error: array of tables is empty!")

        def get_all_tables(self, prefix):
            if self.pdf_api:
                resultTabs = self.pdf_api.get_document_tables(Config.PDF_DOCUMENT_NAME)

                if resultTabs.code == 200 and resultTabs.tables:
                    if not resultTabs.tables.list or len(resultTabs.tables.list) == 0:
                        logging.error("get_all_tables(): Unexpected error - tables is null or empty!!!")
                    self._show_tables_info(resultTabs.tables.list, prefix)
                else:
                    logging.error("get_all_tables(): Unexpected error - can't get links!!!")

        def delete_table(self):
            if self.pdf_api:
                resultTabs = self.pdf_api.delete_table(Config.PDF_DOCUMENT_NAME, Config.TABLE_ID)
                if resultTabs.code == 200:
                    logging.info(f"delete_table(): Table #{Config.TABLE_ID} deleted!")
                else:
                    logging.error("delete_table(): Unexpected error - can't delete table!")

        def delete_tables(self):
            if self.pdf_api:
                resultTabs = self.pdf_api.delete_page_tables(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)

                if resultTabs.code == 200:
                    logging.info(f"delete_tables(): Tables on page #{Config.PAGE_NUMBER} deleted!")
                else:
                    logging.error("delete_tables(): Unexpected error - can't get tables!!!")

    if __name__ == "__main__":
        pdf_tables = PdfTables()
        pdf_tables.upload_document()

        pdf_tables.get_all_tables("All tables")
        pdf_tables.delete_table()
        pdf_tables.get_all_tables("Tables after drop one")

        pdf_tables.delete_tables()
        pdf_tables.get_all_tables("Tables after drop all")

        pdf_tables.download_result()
 

处理 PDF 中的表格

表格为系统地呈现数据提供了结构化格式,使读者更容易理解和分析信息。它们还增强了文档的视觉吸引力,增加了专业性和组织性。在处理数字或对比数据时,表格通过将相关信息分组为易于阅读的格式来提高清晰度。此外,表格可以结合实时或动态生成的内容,如来自数据库或分析仪表板的数据。 使用 Aspose.PDF Cloud Python SDK 从 PDF 文档中删除表格。

使用我们的 Python 库,您可以:

  • 合并 PDF 文档。
  • 拆分 PDF 文件。
  • 将 PDF 转换为其他格式,反之亦然。
  • 操作注释。
  • 处理 PDF 中的图像等。
  • 您可以尝试我们的 免费应用 在线测试功能。