Python SDKで名前でテキストを抽出するためのPDF解析

サーバーサイドPython APIを使用して名前でテキストを抽出するためのPDFドキュメント解析API。

Get Started

NET PHP GO NODEJS

Cloud Python SDKを使用して名前でテキストを抽出するためのPDFドキュメント解析方法

Cloud Python SDKを介して名前でテキストを抽出するためのPDFドキュメントを解析するには、 Aspose.PDF Cloud Python SDK このCloud SDKは、PythonプログラマーがAspose.PDF REST APIを介してPythonプログラミング言語を使用してクラウドベースのPDF作成、注釈、編集、変換、解析アプリを開発するのに役立ちます。Aspose for Cloudでアカウントを作成し、アプリケーション情報を取得してください。App SIDとキーを入手したら、Aspose.PDF Cloud Python SDKを使用する準備が整います。PythonパッケージがGitHubでホストされている場合、GitHubから直接インストールできます:

Githubからのインストール
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Python SDKを使用して名前でテキストを抽出するためのPDF解析手順

Aspose.PDF Cloudの開発者は、名前でテキストを抽出するためのPDFドキュメントを簡単に解析できます。開発者はわずか数行のコードが必要です。

アプリケーションのシークレットとキーを使用して新しいConfigurationオブジェクトを作成します
Cloud APIに接続するオブジェクトを作成します
ドキュメントファイルをアップロードします
get_text_box_field関数を使用してクラウドストレージで名前でテキストを抽出するためのPDFドキュメントを解析します
レスポンスを確認し、結果をログに記録します
必要に応じてJSONファイルとしてテキストボックス情報をローカルにダウンロードします

このサンプルコードは名前でテキストを抽出するためのPDFドキュメントの解析を示します
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractTextBox:
    """Class for extracting text box from PDF document using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

   def Extract(self, documentName: str, texxtboxName: str, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
	response = self.pdf_api.get_text_box_field(documentName, textboxName, **opts)
        if response.code != 200:
            logging.error("ParseExtractTextBox(): Unexpected error!")
        else:
	    logging.info(f"ParseExtractTextBox(): TextBox field '{textboxName}' successfully extracted from the document '{documentName}'.")
            localJsonFile = str(Path.joinpath(localFolder, "text_box_objects.json"))
            with open(localJsonFile, "w", encoding="utf-8") as localFile:            
               jsText = json.dumps(response.field.__dict__, ensure_ascii=False, default=str, indent=4)
               localFile.write(jsText)

Python SDKを使用したPDFのテキスト解析の作業

名前でテキストを抽出するためにPDFドキュメントを解析することにより、必要に応じてTextBoxフィールドの内容を変更できます。これにより、ドキュメント内のテキストの位置を維持しながら、時間を節約し手作業を削減します。 Aspose.PDF Cloud Python SDKを使用して名前でテキストを抽出するためのPDFドキュメントを解析します。

Python SDKを使用すると

テキストまたは画像形式でPDFドキュメントのヘッダーとフッターを追加します。
PDFドキュメントにテーブルやテキストまたは画像スタンプを追加します。
複数のPDFドキュメントを既存のファイルに追加します。
PDFの添付ファイル、注釈、フォームフィールドを操作します。
PDFドキュメントに暗号化または復号化を適用し、パスワードを設定します。
ページまたはPDFドキュメント全体からすべてのスタンプとテーブルを削除します。
IDでPDFドキュメントから特定のスタンプまたはテーブルを削除します。
PDFページまたはドキュメント全体から単一または複数のテキストインスタンスを置換します。
PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
PDFファイルのさまざまな要素を抽出し、PDFドキュメントを最適化します。
機能をテストするために無料アプリを試すことができます。

なぜAspose.PDF Cloud for Pythonなのか？
顧客リスト
セキュリティ

Python SDKで名前でテキストを抽出するためのPDF解析

サーバーサイドPython APIを使用して名前でテキストを抽出するためのPDFドキュメント解析API。

Aspose.PDF Cloud SDK for Python

Overview

Cloud Python SDKを使用して名前でテキストを抽出するためのPDFドキュメント解析方法

Githubからのインストール

Python SDKを使用して名前でテキストを抽出するためのPDF解析手順

このサンプルコードは名前でテキストを抽出するためのPDFドキュメントの解析を示します

Python SDKを使用したPDFのテキスト解析の作業