PNG JPG BMP TIFF PDF
Aspose.PDF  for Python

Python SDK で PDF からテーブルを削除

クラウドを使用して PDF ドキュメントからテーブルを削除するための Cloud Python SDK。

Get Started

Cloud Python SDK を使用して PDF からテーブルを削除する方法

PDF からテーブルを削除するには、 Aspose.PDF Cloud Python SDK を使用します。この Cloud SDK は、Python プログラマーが Aspose.PDF REST API を介して、クラウドベースの PDF 作成、注釈、編集、変換アプリを開発するのを支援します。Aspose for Cloud でアカウントを作成して、アプリケーション情報を取得します。App SID とキーを取得したら、Aspose.PDF Cloud Python SDK を利用する準備が整います。Python パッケージが Github にホストされている場合、Github から直接インストールできます:

Github からのインストール


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

パッケージ マネージャー コンソール コマンド

     
    pip install asposepdfcloud

Python を使用して PDF からテーブルを削除する手順

Aspose.PDF Cloud 開発者は、ほんの数行のコードで PDF からテーブルを簡単に読み込み、削除できます。

  1. Python SDK をインストール
  2. Aspose Cloud サーバーに PDF ドキュメントをアップロード
  3. Aspose Cloud サーバーから処理済みの PDF ドキュメントをダウンロード
  4. すべてのテーブルを取得
  5. テーブルを削除
 

Python を使用して PDF からテーブルを削除


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, Table, Row, Cell, FontStyles, GraphInfo, TextRect, TextState, Color, BorderInfo
    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
        PAGE_NUMBER = 1
        TABLE_ID = "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA"

    class PdfTables:
        """ Class for managing PDF tables using Aspose PDF Cloud API. """
        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """ Initialize the API client. """
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("init_api(): Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"init_api(): Failed to load credentials: {e}")

        def upload_document(self):
            """ Upload a PDF document to the Aspose Cloud server. """
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"upload_document(): File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"upload_document(): Failed to upload file: {e}")

        def download_result(self):
            """ Download the processed PDF document from the Aspose Cloud server. """
            if self.pdf_api:
                try:
                    temp_file = self.pdf_api.download_file(Config.PDF_DOCUMENT_NAME)
                    local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
                    shutil.move(temp_file, str(local_path))
                    logging.info(f"download_result(): File successfully downloaded: {local_path}")
                except Exception as e:
                    logging.error(f"download_result(): Failed to download file: {e}")


        def _show_tables_info(self, tables, prefix):
            if tables and len(tables) > 0 :
                for table in tables:
                    logging.info(f"{prefix} => id: '{table.id}', page: '{table.page_num}', rows: '{len(table.row_list)}', columns: '{len(table.row_list[0].cell_list)}'")
            else:
                logging.error(f"_show_tables_info() error: array of tables is empty!")

        def get_all_tables(self, prefix):
            if self.pdf_api:
                resultTabs = self.pdf_api.get_document_tables(Config.PDF_DOCUMENT_NAME)

                if resultTabs.code == 200 and resultTabs.tables:
                    if not resultTabs.tables.list or len(resultTabs.tables.list) == 0:
                        logging.error("get_all_tables(): Unexpected error - tables is null or empty!!!")
                    self._show_tables_info(resultTabs.tables.list, prefix)
                else:
                    logging.error("get_all_tables(): Unexpected error - can't get links!!!")

        def delete_table(self):
            if self.pdf_api:
                resultTabs = self.pdf_api.delete_table(Config.PDF_DOCUMENT_NAME, Config.TABLE_ID)
                if resultTabs.code == 200:
                    logging.info(f"delete_table(): Table #{Config.TABLE_ID} deleted!")
                else:
                    logging.error("delete_table(): Unexpected error - can't delete table!")

        def delete_tables(self):
            if self.pdf_api:
                resultTabs = self.pdf_api.delete_page_tables(Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)

                if resultTabs.code == 200:
                    logging.info(f"delete_tables(): Tables on page #{Config.PAGE_NUMBER} deleted!")
                else:
                    logging.error("delete_tables(): Unexpected error - can't get tables!!!")

    if __name__ == "__main__":
        pdf_tables = PdfTables()
        pdf_tables.upload_document()

        pdf_tables.get_all_tables("All tables")
        pdf_tables.delete_table()
        pdf_tables.get_all_tables("Tables after drop one")

        pdf_tables.delete_tables()
        pdf_tables.get_all_tables("Tables after drop all")

        pdf_tables.download_result()
 

PDF のテーブルを操作

テーブルはデータを体系的に提示するための構造化された形式を提供し、読者が情報を理解し分析しやすくします。また、ドキュメントの視覚的な魅力を高め、プロフェッショナリズムと組織性を追加します。数値データや比較データを扱う際、テーブルは関連情報を読みやすい形式でグループ化することで明確さを向上させます。さらに、テーブルはデータベースや分析ダッシュボードからのデータなど、リアルタイムまたは動的に生成されたコンテンツを組み込むことができます。 Aspose.PDF Cloud Python SDK を使用して PDF ドキュメントからテーブルを削除します。

Python ライブラリを使用して、以下のことができます:

  • PDF ドキュメントを結合。
  • PDF ファイルを分割。
  • PDF を他の形式に変換し、逆も可能。
  • 注釈を操作。
  • PDF 内の画像を操作、など。
  • 機能をオンラインでテストするために、無料アプリ をお試しください。