HTML
JPG
PDF
XML
DOCX
PDF
Cloud .NET SDK を使用してテキスト抽出のための PDF ドキュメントを解析する方法
Cloud .NET SDK を介してテキスト抽出のために PDF ドキュメントを解析するには、 Aspose.PDF Cloud .NET SDK この Cloud .NET SDK を使用すると、C#、ASP.NET、またはその他の .NET 言語を使用して、さまざまなクラウドプラットフォーム向けのクラウドベースの PDF クリエーター、エディター、およびコンバーターアプリを簡単に構築できます。開く NuGet パッケージマネージャーを開き、検索します Aspose.PDF Cloud そしてインストールします。以下のコマンドをパッケージマネージャーコンソールから使用することもできます。
パッケージマネージャーコンソールコマンド
PM> Install-Package Aspose.Pdf-Cloud
.NET SDK を使用してテキスト抽出のための PDF を解析する手順
Aspose.PDF Cloud 開発者は、簡単に PDF ドキュメントを解析してテキストを抽出できます。開発者はほんの数行のコードを必要とします。
- アプリケーションのシークレットとキーを使用して新しい Configuration オブジェクトを作成する
- クラウド API に接続するオブジェクトを作成する
- ドキュメントファイルをアップロードする
- GetDocumentTextBoxFieldsAsync 関数を使用してクラウドストレージ内の PDF ドキュメントを解析してテキストを抽出する
- レスポンスを確認し、結果をログに記録する
- 操作が成功した場合、抽出されたテキストを印刷する
このサンプルコードは、PDF ドキュメントを解析してテキストを抽出する方法を示しています
using Aspose.Pdf.Cloud.Sdk.Model;
namespace Parser
{
public class GetTextBoxes
{
public static async Task Extract(string documentName, string remoteFolder)
{
// Get your AppSid and AppSecret from https://dashboard.aspose.cloud (free registration required).
pdfApi = new PdfApi(AppSecret, AppSid);
using (var file = File.OpenRead(Path.Combine(localFolder, documentName)))
{ // Upload the local PDF to cloud storage folder name.
FilesUploadResult uploadResponse = await pdfApi.UploadFileAsync(Path.Combine(remoteFolder, documentName), documentName);
Console.WriteLine(uploadResponse.Uploaded[0]);
}
// Parse PDF to extract text boxes in cloud storage.
TextBoxFieldsResponse response = await pdfApi.GetDocumentTextBoxFieldsAsync(documentName, folder: remoteFolder);
// Checks the response and logs the result.
if (response == null)
Console.WriteLine("GetTextBoxes(): Unexpected error!");
else if (response.Code < 200 || response.Code > 299)
Console.WriteLine("GetTextBoxes(): Failed to receive TextBox fields from the document.");
else
{ // Show text boxes.
Console.WriteLine("GetTextBoxes(): TextBox fields successfully received from the document '{0}.", documentName);
foreach (TextBoxField textBox in response.Fields.List)
{
Console.WriteLine(textBox.ToString());
}
}
}
}
}
.NET SDK を介して PDF のテキスト解析を行う
PDF ドキュメントを解析してテキストを抽出することで、必要に応じてテキストボックスフィールドの内容を変更できます。これにより、ドキュメント内のテキストの位置が維持され、時間を節約し、手作業を減らすことができます。 Aspose.PDF Cloud .NET SDK を使用して PDF ドキュメントを解析してテキストを抽出します。
私たちの .NET SDK を使用すると、以下のことが可能です
- PDF ドキュメントのヘッダーとフッターをテキストまたは画像形式で追加します。
- PDF ドキュメントにテーブルやテキストまたは画像のスタンプを追加します。
- 複数の PDF ドキュメントを既存のファイルに追加します。
- PDF の添付ファイル、注釈、およびフォームフィールドを操作します。
- PDF ドキュメントに暗号化または復号化を適用し、パスワードを設定します。
- ページまたは PDF ドキュメント全体からすべてのスタンプとテーブルを削除します。
- PDF ドキュメントから ID に基づいて特定のスタンプまたはテーブルを削除します。
- PDF ページまたはドキュメント全体から単一または複数のテキストインスタンスを置き換えます。
- PDF ドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
- PDF ファイルのさまざまな要素を抽出し、PDF ドキュメントを最適化します。
- 無料アプリを試して、機能をテストできます。