HTML
JPG
PDF
XML
DOCX
PDF
Cloud Go SDKを使用してテーブル抽出のためのPDFドキュメントを解析する方法
Cloud Go SDKを通じてテーブルを抽出するためにPDFドキュメントを解析するには、 Aspose.PDF Cloud Go SDK このCloud Go SDKは、Goプログラミング言語を用いてGoプログラマーがクラウドベースのPDF作成者、注釈、編集者、コンバーター、及びパーサーアプリを開発するのを支援します。次のコマンドをパッケージマネージャーコンソールから使用してください。
パッケージマネージャーコンソールコマンド
go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
Go SDKを使用してテーブル抽出のためのPDFを解析する手順
Aspose.PDF Cloud開発者は、簡単にPDFドキュメントを解析してテーブルを抽出できます。開発者は数行のコードのみが必要です。
- アプリケーションシークレットとキーを使用して新しいConfigurationオブジェクトを作成
- クラウドAPIに接続するオブジェクトを作成
- ドキュメントファイルをアップロード
- GetDocumentTables関数を使用してクラウドストレージでテーブル抽出のためにPDFドキュメントを解析
- 応答を確認し、結果をログに記録
- 必要に応じてテーブル情報をJSONファイルとしてローカルにダウンロード
このサンプルコードは、テーブル抽出のためのPDFドキュメントを解析することを示しています
package main
import (
"encoding/json"
"fmt"
"os"
"path"
asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)
// Extract Tables from the document
func ParseExtractTables(documentName string, localFolder string, remoteFolder string) {
// Get your AppSecret and Key from https://dashboard.aspose.cloud (free registration required).
pdf_api := asposepdfcloud.NewPdfApiService(APP_SID, APP_KEY, "")
args := map[string]interface{}{
"folder": remoteFolder,
}
file, _ := os.Open(path.Join(localFolder, documentName))
_, _, _ = pdf_api.UploadFile(path.Join(remoteFolder, documentName), file, args)
result, httpResponse, err := pdf_api.GetDocumentTables(documentName, args)
if err != nil {
fmt.Println(err.Error())
} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
fmt.Println("ExtractTables(): Failed to extract tables from the document.")
} else {
if result.Tables == nil || len(result.Tables.List) == 0 {
fmt.Println("ExtractTables(): Tables not found in the document.")
} else {
resultJson := "[\n"
for _, table := range result.Tables.List {
fmt.Println("table", table)
jsTable, _ := json.Marshal(table)
resultJson += string(jsTable) + ",\n\n"
}
resultJson += "]"
fileName := path.Join(localFolder, ("parsed_tables_output_go.json"))
f, _ := os.Create(fileName)
_, _ = f.Write([]byte(resultJson))
fmt.Println("File '" + fileName + "' successfully downloaded.")
}
}
}
Go SDKを介してPDFでテーブル解析を行う
テーブル抽出のためにPDFドキュメントを解析することにより、必要に応じてテーブルの内容を変更できます。これにより、ドキュメント内のテーブルの位置を維持しながら、時間を節約し手作業を減らします。 Aspose.PDF Cloud Go SDKでテーブル抽出のためにPDFドキュメントを解析。
私たちのGo SDKでできること
- PDFドキュメントのヘッダーとフッターをテキストまたは画像形式で追加。
- PDFドキュメントにテーブルとテキストまたは画像スタンプを追加。
- 複数のPDFドキュメントを既存のファイルに追加。
- PDF添付ファイル、注釈、フォームフィールドを扱う。
- PDFドキュメントに暗号化または復号化を適用し、パスワードを設定。
- ページまたはPDFドキュメント全体からすべてのスタンプとテーブルを削除。
- PDFドキュメントからIDで特定のスタンプまたはテーブルを削除。
- PDFページまたは全体のドキュメントからテキストの単一または複数のインスタンスを置換。
- PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
- PDFファイルのさまざまな要素を抽出してPDFドキュメントを最適化。
- 機能をテストするために無料アプリを試すことができます。