HTML JPG PDF XML DOCX
  Product Family
PDF

Java SDK で PDF を解析し、フォームフィールドを XML に抽出

サーバーサイドの Java API を使用して、PDF ドキュメントからフォームフィールドを XML として抽出する API

Get Started

Cloud Java SDK を使用して PDF ドキュメントからフォームフィールドを XML として抽出する方法

Cloud Java SDK を使用して PDF ドキュメントからフォームフィールドを XML として抽出するには、次のものを使用します Aspose.PDF Cloud Java SDK この Cloud Java SDK を使用すると、さまざまなクラウドプラットフォーム向けに、Java 言語でクラウドベースの PDF 作成、編集、変換アプリケーションを簡単に構築できます。開く Repository パッケージマネージャで Aspose.PDF Cloud を検索してください そしてインストールします。Package Manager コンソールから次のコマンドを使用して Maven でインストールすることもできます。

Aspose Cloud リポジトリをアプリケーションの pom.xml に追加する

Aspose Cloud リポジトリの追加


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

API クライアントライブラリをローカルの Maven リポジトリにインストールするには、次のコマンドを実行してください。

Github からのインストール


    mvn clean install

代わりにリモート Maven リポジトリにデプロイする場合は、リポジトリの設定を構成し、以下を実行してください。

Maven リポジトリのデプロイ


    mvn clean deploy

Java SDK を使用した PDF のフォームフィールド抽出 (XML) の手順

Aspose.PDF Cloud の開発者は、PDF ドキュメントからフォームフィールドを XML として簡単に抽出できます。数行のコードだけで実現できます。

  1. アプリケーションシークレットとキーを使用して新しい Configuration オブジェクトを作成する
  2. Cloud API に接続するオブジェクトを作成する
  3. ドキュメントファイルをアップロードする
  4. getExportFieldsFromPdfToXmlInStorage 関数を使用して、クラウドストレージ上で PDF ドキュメントのフォームフィールドを XML として抽出する
  5. 応答をチェックし、結果をログに記録する
  6. 必要に応じて XNL ファイルをローカルにダウンロードする
 

このサンプルコードは PDF ドキュメントをパースし、フォームフィールドを XML として抽出する方法を示しています


    import java.io.File;
    import java.nio.file.Path;
    import java.nio.file.StandardCopyOption;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdfusecases.pages.PagesHelper;

    public class ParseFormsXml {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String XML_OUTPUT_FILE = "output_sample.xml";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                //Perform action
                File f = pdfApi.getExportFieldsFromPdfToXmlInStorage(PDF_DOCUMENT, null, REMOTE_FOLDER);

                // save file
                java.nio.file.Files.copy(Path.of(f.getPath()), Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE), StandardCopyOption.REPLACE_EXISTING);
                System.out.println(String.format("File '%s' successfully dowloaded!", Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE).toString()));                
                System.out.println("Successfully parsed PDF fields as XML ! '" + XML_OUTPUT_FILE + "'");

            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

.NET SDK を使用した PDF のフォームパースの操作

PDF ドキュメントを XML 形式でフォームフィールドを抽出するようにパースすることで、各フォームフィールドの有効性と関連性を体系的に検証でき、すべての参照が最新かつ機能していることを保証できます。フォームフィールドを XML としてダウンロードしたり、バッチ分析を実施したりするタスクにおいて、フォームフィールドの抽出は自動化を可能にし、時間の節約と手作業の削減につながります。 Aspose.PDF Cloud Java SDK を使用して、PDF ドキュメントからフォームフィールドを XML として抽出します。

Java SDK でできること

  • PDF ドキュメントにテキストまたは画像形式でヘッダーとフッターを追加できます。
  • PDF ドキュメントに表やテキスト・画像スタンプを追加できます。
  • 複数の PDF ドキュメントを既存のファイルに追加できます。
  • PDF の添付ファイル、注釈、フォームフィールドを操作できます。
  • PDFドキュメントに暗号化または復号を適用し、パスワードを設定します。
  • ページまたはPDF全体からすべてのスタンプとテーブルを削除します。
  • IDで指定された特定のスタンプまたはテーブルをPDFドキュメントから削除します。
  • PDFページ上、またはドキュメント全体のテキストを単一または複数置換します。
  • PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
  • PDFファイルのさまざまな要素を抽出し、PDFドキュメントを最適化します。
  • 機能をテストするために、無料アプリをご利用いただけます。

  •