HTML
JPG
PDF
XML
DOCX
PDF
Cloud .NET SDK を使用して PDF からページ上のテーブルを抽出する方法
Cloud .NET SDK を使用して PDF からページ上のテーブルを抽出するために、 Aspose.PDF Cloud .NET SDK この Cloud SDK を使用すると、C#、ASP.NET、またはその他の .NET 言語でさまざまなクラウドプラットフォーム向けにクラウドベースの PDF 作成、編集、変換アプリを簡単に構築できます。開く NuGet パッケージマネージャーを開き、検索します Aspose.PDF Cloud をインストールします。また、パッケージマネージャーコンソールから次のコマンドを使用することもできます。
パッケージマネージャーコンソールコマンド
PM> Install-Package Aspose.Pdf-Cloud
.NET SDK を使用して PDF からページ上のテーブルを抽出する手順
Aspose.PDF Cloud 開発者は、ほんの数行のコードで簡単に PDF からページ上のテーブルを読み込み、取得できます。
- アプリケーションシークレットとキーを使用して新しい Configuration オブジェクトを作成します。
- Cloud API に接続するためのオブジェクトを作成します。
- PDF をクラウドストレージにアップロードします。
- GetPageTablesAsync 関数を使用してクラウドストレージ内の PDF からページ上のテーブルを抽出します。
- 応答を確認し、結果を記録します。
- 操作が成功した場合、テーブルを印刷します。
このサンプルコードは PDF ドキュメントからページ上のテーブルを抽出する方法を示しています
using Aspose.Pdf.Cloud.Sdk.Model;
namespace Tables
{
public class GetTablesOnPage
{
public static async Task Extract(string documentName, int pageNumber, string remoteFolder)
{
// Get your AppSid and AppSecret from https://dashboard.aspose.cloud (free registration required).
pdfApi = new PdfApi(AppSecret, AppSid);
using (var file = File.OpenRead(Path.Combine(localFolder, documentName)))
{ // Upload the local PDF to cloud storage folder name.
FilesUploadResult uploadResponse = await pdfApi.UploadFileAsync(Path.Combine(remoteFolder, documentName), documentName);
Console.WriteLine(uploadResponse.Uploaded[0]);
}
// Get all tables on page from the PDF on cloud storage.
TablesRecognizedResponse response = await pdfApi.GetPageTablesAsync(documentName, pageNumber, folder: remoteFolder);
// Checks the response and logs the result.
if (response == null)
Console.WriteLine("GetTablesOnPage(): Unexpected error!");
else if (response.Code < 200 || response.Code > 299)
Console.WriteLine("GetTablesOnPage(): Failed to extract tables from the document.");
else
{ // If the operation was successful, print the tables or make some other actions
Console.WriteLine("GetTablesOnPage(): All tables on '{0}' page successfully extracted from the document '{1}.", pageNumber, documentName);
foreach (var table in response.Tables.List)
{
Console.WriteLine(table.ToString());
}
}
}
}
}
PDF 内のテーブルを操作する
テーブルはデータを体系的に提示するための構造化された形式を提供し、読者が情報を理解し分析しやすくします。また、ドキュメントの視覚的な魅力を高め、プロフェッショナリズムと組織性を加えます。数値データや比較データを扱う場合、テーブルは関連情報を読みやすい形式でグループ化することで明確さを向上させます。さらに、テーブルはデータベースや分析ダッシュボードからのデータなど、リアルタイムまたは動的に生成されたコンテンツを組み込むことができます。 Aspose.PDF Cloud Node.js SDK を使用して、PDF ドキュメントからページ上のすべてのテーブルを取得します。
.NET ライブラリを使用すると、次のことができます:
- PDF ドキュメントのヘッダーとフッターをテキストまたは画像形式で追加します。
- PDF ドキュメントにテーブルとスタンプ(テキストまたは画像)を追加します。
- 複数の PDF ドキュメントを既存のファイルに追加します。
- PDF の添付ファイル、注釈、フォームフィールドを操作します。
- PDF ドキュメントに暗号化または復号化を適用し、パスワードを設定します。
- ページまたは PDF ドキュメント全体からすべてのスタンプとテーブルを削除します。
- PDF ドキュメントから ID によって特定のスタンプまたはテーブルを削除します。
- PDF ページまたはドキュメント全体からテキストの単一または複数のインスタンスを置き換えます。
- PDF ドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
- PDF ファイルのさまざまな要素を抽出し、PDF ドキュメントを最適化します。
- 無料アプリを試して、オンラインで PDF ファイルにテーブルを抽出し、機能をテストできます。