HTML JPG PDF XML DOCX
  Product Family
PDF

Java SDKでPDFからテーブルを取得

サーバーサイド Java API を使用して PDF ドキュメントからすべてのテーブルを取得

Get Started

Cloud Java SDK を使用して PDF からテーブルを抽出する方法

Cloud Java SDK を使用して PDF からテーブルを抽出するには、次を使用します Aspose.PDF Cloud Java SDK このクラウド SDK を使用すると、さまざまなクラウド プラットフォーム向けに Java 言語でクラウドベースの PDF 作成・編集・変換アプリを簡単に構築できます。開く Repository パッケージ マネージャで Aspose.PDF Cloud を検索してください そしてインストールします。Package Manager Console から Maven を使用してインストールする場合は、以下のコマンドを使用できます。

アプリケーションの pom.xml に Aspose Cloud リポジトリを追加します

Aspose Cloud リポジトリの追加


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

ローカル Maven リポジトリに API クライアント ライブラリをインストールするには、次のコマンドを実行してください:

GitHub からのインストール


    mvn clean install

代わりにリモート Maven リポジトリへデプロイするには、リポジトリの設定を構成し、次を実行してください:

Maven リポジトリのデプロイ


    mvn clean deploy

Java SDK を使用して PDF からテーブルを抽出する手順

Aspose.PDF Cloud の開発者は、数行のコードで簡単に PDF からテーブルをロード&取得できます。

  1. アプリケーションのシークレットとキーを使用して新しい Configuration オブジェクトを作成します。
  2. Cloud API に接続するオブジェクトを作成します。
  3. PDF をクラウド ストレージにアップロードします。
  4. getDocumentTables 関数を使用して、クラウド ストレージ上の PDF からテーブルを抽出します。
  5. 応答を確認し、結果をログに記録します。
  6. 操作が成功した場合、テーブルを出力します
 

このサンプルコードは PDF ドキュメントからテーブルを抽出する例を示しています


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtarctAll {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

PDF のテーブル操作

テーブルはデータを体系的に提示するための構造化された形式を提供し、読者が情報を理解し分析しやすくします。また、ドキュメントの視覚的な魅力を高め、プロフェッショナリズムと整理整頓を加えます。数値データや比較データを扱う際、テーブルは関連情報を読みやすい形式でグループ化することで明瞭性を向上させます。さらに、テーブルはデータベースや分析ダッシュボードからのデータなど、リアルタイムまたは動的に生成されたコンテンツを組み込むことも可能です。 Aspose.PDF Cloud Java SDK を使用して PDF ドキュメントからすべてのテーブルを取得します。

この Java ライブラリでできること:

  • PDF ドキュメントのヘッダーとフッターをテキストまたは画像形式で追加します。
  • PDF ドキュメントにテーブルやスタンプ(テキストまたは画像)を追加します。
  • 既存ファイルに複数の PDF ドキュメントを結合します。
  • PDF の添付ファイル、注釈、フォーム フィールドを操作します。
  • PDF文書に暗号化または復号化を適用し、パスワードを設定します。
  • ページまたはPDF文書全体からすべてのスタンプとテーブルを削除します。
  • IDで指定した特定のスタンプまたはテーブルをPDF文書から削除します。
  • PDFページ上または文書全体から単一または複数のテキストインスタンスを置換します。
  • PDF文書をさまざまな他のファイル形式に変換するための広範なサポート。
  • PDFファイルのさまざまな要素を抽出し、PDF文書を最適化します。
  • 無料アプリをご利用いただき、オンラインでPDFファイルからテーブルを抽出し、機能をテストできます。

  •