Cloud Java SDK を使用して PDF のページ上のテーブルを抽出する方法
Cloud Java SDK を使用して PDF のページ上のテーブルを抽出するには、次のものを使用します Aspose.PDF Cloud Java SDK この Cloud SDK を使用すると、C#、ASPJava、またはその他の Java 言語で、さまざまなクラウドプラットフォーム向けのクラウドベースの PDF 作成、編集、変換アプリケーションを簡単に構築できます。Open Repository パッケージマネージャで「Aspose.PDF Cloud」を検索 そしてインストールします。Package Manager Console から次のコマンドを使用して Maven でインストールすることもできます。
アプリケーションの pom.xml に Aspose Cloud リポジトリを追加
Aspose Cloud リポジトリの追加
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
API クライアントライブラリをローカルの Maven リポジトリにインストールするには、次のコマンドを実行してください。
GitHub からのインストール
mvn clean install
代わりにリモート Maven リポジトリへデプロイするには、リポジトリの設定を構成し、次のコマンドを実行します。
Maven リポジトリのデプロイ
mvn clean deploy
Java SDK を使用して PDF のページ上のテーブルを抽出する手順
Aspose.PDF Cloud 開発者は、数行のコードで PDF からページ上のテーブルを簡単にロードして取得できます。
- アプリケーションシークレットとキーを使用して新しい Configuration オブジェクトを作成します。
- Cloud API に接続するオブジェクトを作成します。
- PDF をクラウドストレージにアップロードします。
- getPageTables 関数を使用して、クラウドストレージ上の PDF からページ上のテーブルを抽出します。
- 応答をチェックし、結果をログに記録します。
- 操作が成功した場合、テーブルを出力します
このサンプルコードは、PDF ドキュメントからページ上のテーブルを抽出する方法を示しています
import java.io.File;
import java.nio.file.Path;
import com.google.gson.Gson;
import com.google.gson.GsonBuilder;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TableRecognized;
import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;
public class TablesExtractOnPage {
public static void perform() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
Integer PAGE_NUMBER = 1;
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// paerform actionPDF_OUTPUT
TablesRecognizedResponse response = pdfApi.getPageTables(PDF_DOCUMENT, PAGE_NUMBER, null, REMOTE_FOLDER);
if (response.getCode() != 200)
System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
System.err.println("Error: Tables not found!");
}
else {
// Show tables info...
Gson gson = new GsonBuilder().setPrettyPrinting().create();
for (TableRecognized tab : response.getTables().getList()) {
String jsonTab = gson.toJson(tab);
System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
PDF のテーブル操作
テーブルは、データを体系的に提示するための構造化されたフォーマットを提供し、読者が情報を理解・分析しやすくします。また、文書の視覚的魅力を高め、プロフェッショナルさと整理整頓を加えます。数値データや比較データを扱う場合、関連情報を見やすい形式でグループ化することで、テーブルは明瞭さを向上させます。さらに、テーブルはデータベースや分析ダッシュボードからのデータなど、リアルタイムまたは動的に生成されたコンテンツを組み込むことも可能です。 Aspose.PDF Cloud Java SDK を使用して、PDF ドキュメントからページ上のすべてのテーブルを取得します。
この Java ライブラリでできること:
- PDF ドキュメントのヘッダー・フッターをテキストまたは画像形式で追加。
- テーブルやスタンプ(テキストまたは画像)を PDF ドキュメントに追加。
- 複数の PDF ドキュメントを既存のファイルに追加。
- PDF の添付ファイル、注釈、フォームフィールドを操作。
- PDF 文書に暗号化または復号化を適用し、パスワードを設定します。
- ページまたは PDF 文書全体からすべてのスタンプとテーブルを削除します。
- ID によって PDF 文書から特定のスタンプまたはテーブルを削除します。
- PDF ページ上または文書全体から単一または複数のテキストインスタンスを置換します。
- PDF 文書をさまざまな他のファイル形式に変換するための広範なサポートを提供します。
- PDF ファイルのさまざまな要素を抽出し、PDF 文書を最適化します。
- 当社の無料アプリを試して、オンラインで PDF ファイルからテーブルを抽出し、機能をテストできます。
- Learning Resources
- Documentation
- Source Code
- API References
- Product Support
- Free Support
- Paid Support
- Blog
- Why Aspose.PDF Cloud for Java?
- Customers List
- Security