HTML JPG PDF XML DOCX
  Product Family
PDF

Java SDK で PDF のページ上のテーブルを取得

サーバー側 Java API を使用して PDF ドキュメントからページ上のすべてのテーブルを取得

Get Started

Cloud Java SDK を使用して PDF のページ上のテーブルを抽出する方法

Cloud Java SDK を使用して PDF のページ上のテーブルを抽出するには、次のものを使用します Aspose.PDF Cloud Java SDK この Cloud SDK を使用すると、C#、ASPJava、またはその他の Java 言語で、さまざまなクラウドプラットフォーム向けのクラウドベースの PDF 作成、編集、変換アプリケーションを簡単に構築できます。Open Repository パッケージマネージャで「Aspose.PDF Cloud」を検索 そしてインストールします。Package Manager Console から次のコマンドを使用して Maven でインストールすることもできます。

アプリケーションの pom.xml に Aspose Cloud リポジトリを追加

Aspose Cloud リポジトリの追加


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

API クライアントライブラリをローカルの Maven リポジトリにインストールするには、次のコマンドを実行してください。

GitHub からのインストール


    mvn clean install

代わりにリモート Maven リポジトリへデプロイするには、リポジトリの設定を構成し、次のコマンドを実行します。

Maven リポジトリのデプロイ


    mvn clean deploy

Java SDK を使用して PDF のページ上のテーブルを抽出する手順

Aspose.PDF Cloud 開発者は、数行のコードで PDF からページ上のテーブルを簡単にロードして取得できます。

  1. アプリケーションシークレットとキーを使用して新しい Configuration オブジェクトを作成します。
  2. Cloud API に接続するオブジェクトを作成します。
  3. PDF をクラウドストレージにアップロードします。
  4. getPageTables 関数を使用して、クラウドストレージ上の PDF からページ上のテーブルを抽出します。
  5. 応答をチェックし、結果をログに記録します。
  6. 操作が成功した場合、テーブルを出力します
 

このサンプルコードは、PDF ドキュメントからページ上のテーブルを抽出する方法を示しています


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtractOnPage {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
            Integer PAGE_NUMBER    = 1;

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getPageTables(PDF_DOCUMENT, PAGE_NUMBER, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

PDF のテーブル操作

テーブルは、データを体系的に提示するための構造化されたフォーマットを提供し、読者が情報を理解・分析しやすくします。また、文書の視覚的魅力を高め、プロフェッショナルさと整理整頓を加えます。数値データや比較データを扱う場合、関連情報を見やすい形式でグループ化することで、テーブルは明瞭さを向上させます。さらに、テーブルはデータベースや分析ダッシュボードからのデータなど、リアルタイムまたは動的に生成されたコンテンツを組み込むことも可能です。 Aspose.PDF Cloud Java SDK を使用して、PDF ドキュメントからページ上のすべてのテーブルを取得します。

この Java ライブラリでできること:

  • PDF ドキュメントのヘッダー・フッターをテキストまたは画像形式で追加。
  • テーブルやスタンプ(テキストまたは画像)を PDF ドキュメントに追加。
  • 複数の PDF ドキュメントを既存のファイルに追加。
  • PDF の添付ファイル、注釈、フォームフィールドを操作。
  • PDF 文書に暗号化または復号化を適用し、パスワードを設定します。
  • ページまたは PDF 文書全体からすべてのスタンプとテーブルを削除します。
  • ID によって PDF 文書から特定のスタンプまたはテーブルを削除します。
  • PDF ページ上または文書全体から単一または複数のテキストインスタンスを置換します。
  • PDF 文書をさまざまな他のファイル形式に変換するための広範なサポートを提供します。
  • PDF ファイルのさまざまな要素を抽出し、PDF 文書を最適化します。
  • 当社の無料アプリを試して、オンラインで PDF ファイルからテーブルを抽出し、機能をテストできます。

  •