HTML
JPG
PDF
XML
DOCX
PDF
Python SDKでPDFを解析してFDFとしてフォームフィールドを抽出
サーバーサイドPython APIを使用してPDFドキュメントを解析し、FDFとしてフォームフィールドを抽出するためのAPI。
Get StartedCloud Python SDKを使用してPDFドキュメントを解析し、FDFとしてフォームフィールドを抽出する方法
Cloud Python SDKを使用して、PDFドキュメントを解析し、FDFとしてフォームフィールドを抽出するためには、 Aspose.PDF Cloud Python SDK このCloud SDKは、PythonプログラマーがAspose.PDF REST APIを使用してクラウドベースのPDFクリエーター、アノテーター、エディター、コンバーター、パーサーアプリをPythonプログラミング言語で開発するのを支援します。Aspose for Cloudでアカウントを作成し、アプリケーション情報を取得してください。App SIDとキーを取得したら、Aspose.PDF Cloud Python SDKを始める準備が整います。PythonパッケージがGithubにホストされている場合は、Githubから直接インストールできます。
Githubからのインストール
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
パッケージマネージャコンソールコマンド
pip install asposepdfcloud
Python SDKを使用してPDFを解析し、FDFとしてフォームフィールドを抽出する手順
Aspose.PDF Cloudの開発者は、PDFドキュメントを簡単に解析してFDFとしてフォームフィールドを抽出できます。開発者はわずか数行のコードを必要とします。
- アプリケーションの秘密鍵とキーを使用して新しいConfigurationオブジェクトを作成
- Cloud APIに接続するオブジェクトを作成
- ドキュメントファイルをアップロード
- put_export_fields_from_pdf_to_fdf_in_storage関数を使用して、クラウドストレージでPDFドキュメントを解析し、FDFとしてフォームフィールドを抽出
- レスポンスを確認し、結果をログに記録
- 必要に応じてFDFファイルをローカルにダウンロード
このサンプルコードは、PDFドキュメントを解析してFDFとしてフォームフィールドを抽出する方法を示しています
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class ExportFormToFDF:
"""Class for extracting PDF form fields into FDF using Aspose PDF Cloud API."""
def __init__(self):
self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)
def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = localFolder / documentName
try:
if remoteFolder == None:
self.pdf_api.upload_file(documentName, str(file_path))
else:
opts = { "folder": remoteFolder }
self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
logging.info(f"File {documentName} uploaded successfully.")
except Exception as e:
logging.error(f"Failed to upload file: {e}")
def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str, output_prefix: str):
"""Download the processed PDF document from the Aspose Cloud server."""
if self.pdf_api:
try:
temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
local_path = localFolder / ( output_prefix + outputDocument )
shutil.move(temp_file, str(local_path))
logging.info(f"download_result(): File successfully downloaded: {local_path}")
except Exception as e:
logging.error(f"download_result(): Failed to download file: {e}")
def Extract(self, documentName: str, outputFDFName: str, localFolder: Path, remoteFolder: str ):
self.uploadDocument(documentName, remoteFolder)
fdfPath = str(Path.joinpath(Path(remoteFolder), outputFDFName))
opts = {
"folder": remoteFolder
}
response = self.pdf_api.put_export_fields_from_pdf_to_fdf_in_storage(documentName, fdfPath, **opts)
if response.code != 200:
logging.error("ExportFormToFDF(): Unexpected error!")
else:
logging.info(f"ExportFormToFDF(): Pdf document '{documentName}' form fields successfully exported to '{outputFDFName}' file.")
self.helper.downloadFile(outputFDFName, outputFDFName, localFolder, remoteFolder, "")
Python SDKを介してPDF内のフォーム解析を操作
PDFドキュメントを解析してFDFとしてフォームフィールドを抽出することで、各フォームフィールドの有効性と関連性を体系的に検証し、すべての参照が最新で機能していることを確認できます。FDFとしてのフォームフィールドのダウンロードやバッチ分析の実施などのタスクにおいて、フォームフィールドを抽出することで自動化が可能になり、時間を節約し手作業を削減します。 Aspose.PDF Cloud Python SDKを使用して、FDFとしてフォームフィールドを抽出するためにPDFドキュメントを解析します。
Python SDKを使用することで、次のことができます
- PDFドキュメントのヘッダーとフッターをテキストまたは画像形式で追加。
- PDFドキュメントにテーブルやテキスト、または画像スタンプを追加。
- 複数のPDFドキュメントを既存のファイルに追加。
- PDFの添付ファイル、注釈、フォームフィールドを操作。
- PDFドキュメントに暗号化または復号を適用し、パスワードを設定。
- ページまたはPDFドキュメント全体からすべてのスタンプとテーブルを削除。
- PDFドキュメントからIDで特定のスタンプまたはテーブルを削除。
- PDFページまたはドキュメント全体のテキストの単一または複数のインスタンスを置換。
- PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
- PDFファイルのさまざまな要素を抽出し、PDFドキュメントを最適化。
- 機能をテストするために無料アプリを試すことができます。