Java SDK で PDF を解析し、フォームフィールドを XML に抽出
サーバーサイドの Java API を使用して、PDF ドキュメントからフォームフィールドを XML として抽出する API
Get StartedCloud Java SDK を使用して PDF ドキュメントからフォームフィールドを XML として抽出する方法
Cloud Java SDK を使用して PDF ドキュメントからフォームフィールドを XML として抽出するには、次のものを使用します Aspose.PDF Cloud Java SDK この Cloud Java SDK を使用すると、さまざまなクラウドプラットフォーム向けに、Java 言語でクラウドベースの PDF 作成、編集、変換アプリケーションを簡単に構築できます。開く Repository パッケージマネージャで Aspose.PDF Cloud を検索してください そしてインストールします。Package Manager コンソールから次のコマンドを使用して Maven でインストールすることもできます。
Aspose Cloud リポジトリをアプリケーションの pom.xml に追加する
Aspose Cloud リポジトリの追加
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
API クライアントライブラリをローカルの Maven リポジトリにインストールするには、次のコマンドを実行してください。
Github からのインストール
mvn clean install
代わりにリモート Maven リポジトリにデプロイする場合は、リポジトリの設定を構成し、以下を実行してください。
Maven リポジトリのデプロイ
mvn clean deploy
Java SDK を使用した PDF のフォームフィールド抽出 (XML) の手順
Aspose.PDF Cloud の開発者は、PDF ドキュメントからフォームフィールドを XML として簡単に抽出できます。数行のコードだけで実現できます。
- アプリケーションシークレットとキーを使用して新しい Configuration オブジェクトを作成する
- Cloud API に接続するオブジェクトを作成する
- ドキュメントファイルをアップロードする
- getExportFieldsFromPdfToXmlInStorage 関数を使用して、クラウドストレージ上で PDF ドキュメントのフォームフィールドを XML として抽出する
- 応答をチェックし、結果をログに記録する
- 必要に応じて XNL ファイルをローカルにダウンロードする
このサンプルコードは PDF ドキュメントをパースし、フォームフィールドを XML として抽出する方法を示しています
import java.io.File;
import java.nio.file.Path;
import java.nio.file.StandardCopyOption;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdfusecases.pages.PagesHelper;
public class ParseFormsXml {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String XML_OUTPUT_FILE = "output_sample.xml";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
//Perform action
File f = pdfApi.getExportFieldsFromPdfToXmlInStorage(PDF_DOCUMENT, null, REMOTE_FOLDER);
// save file
java.nio.file.Files.copy(Path.of(f.getPath()), Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE), StandardCopyOption.REPLACE_EXISTING);
System.out.println(String.format("File '%s' successfully dowloaded!", Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE).toString()));
System.out.println("Successfully parsed PDF fields as XML ! '" + XML_OUTPUT_FILE + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
.NET SDK を使用した PDF のフォームパースの操作
PDF ドキュメントを XML 形式でフォームフィールドを抽出するようにパースすることで、各フォームフィールドの有効性と関連性を体系的に検証でき、すべての参照が最新かつ機能していることを保証できます。フォームフィールドを XML としてダウンロードしたり、バッチ分析を実施したりするタスクにおいて、フォームフィールドの抽出は自動化を可能にし、時間の節約と手作業の削減につながります。 Aspose.PDF Cloud Java SDK を使用して、PDF ドキュメントからフォームフィールドを XML として抽出します。
Java SDK でできること
- PDF ドキュメントにテキストまたは画像形式でヘッダーとフッターを追加できます。
- PDF ドキュメントに表やテキスト・画像スタンプを追加できます。
- 複数の PDF ドキュメントを既存のファイルに追加できます。
- PDF の添付ファイル、注釈、フォームフィールドを操作できます。
- PDFドキュメントに暗号化または復号を適用し、パスワードを設定します。
- ページまたはPDF全体からすべてのスタンプとテーブルを削除します。
- IDで指定された特定のスタンプまたはテーブルをPDFドキュメントから削除します。
- PDFページ上、またはドキュメント全体のテキストを単一または複数置換します。
- PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
- PDFファイルのさまざまな要素を抽出し、PDFドキュメントを最適化します。
- 機能をテストするために、無料アプリをご利用いただけます。