HTML JPG PDF XML DOCX
  Product Family
PDF

Node.js SDKで表抽出のためにPDFを解析する

サーバーサイドNode.js APIを使用してPDFドキュメントを解析して表を抽出するためのAPI。

Get Started

Cloud Node.js SDKを使用して表抽出のためにPDFドキュメントを解析する方法

Cloud Node.js SDKを介して表抽出のためにPDFドキュメントを解析するには、 Aspose.PDF Cloud Node.js SDK このCloud SDKは、Node.jsプログラマーがAspose.PDF REST APIを介してNode.jsプログラミング言語を使用してクラウドベースのPDF作成、注釈付け、編集、変換、解析アプリを開発するのを支援します。Aspose for Cloudでアカウントを作成し、アプリケーション情報を取得します。App SIDとキーを取得したら、Aspose.PDF Cloud Node.js SDKを使用する準備が整います。

パッケージマネージャーコンソールコマンド


     
    npm install asposepdfcloud --save
     
     

Node.js SDKを使用して表抽出のためにPDFを解析する手順

Aspose.PDF Cloud開発者は、表抽出のためにPDFドキュメントを簡単に解析できます。開発者はほんの数行のコードを必要とします。

  1. アプリケーションシークレットとキーを使用して新しいConfigurationオブジェクトを作成する
  2. クラウドAPIに接続するためのオブジェクトを作成する
  3. ドキュメントファイルをアップロードする
  4. getDocumentTables関数を使用してクラウドストレージで表抽出のためにPDFドキュメントを解析する
  5. 応答を確認し、結果をログに記録する
  6. 必要に応じてJSONファイルに表情報をローカルにダウンロードする
 

このサンプルコードは表抽出のためにPDFドキュメントを解析する方法を示しています


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTables};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTables = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getDocumentTables( documentName, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportTables(): Tables successfully extracted!");

                var result = "[\n";
                await Promise.all(
                    response.body.tables.list.map(async (table) => {
                        const responseTable = await pdfApi.getTable(documentName, table.id, null, remoteFolder)
                            .then(function(responseTable){
                                result += JSON.stringify(table) + ",\n\n";
                            });
                        })
                    );
                result += "]";

                const filePath = path.join(localFolder, "parsed_tables_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTables(): Unexpected error!") 

        }
    }
};
 

Node.js SDKを介してPDF内の表解析を行う

表抽出のためにPDFドキュメントを解析することにより、表のコンテンツを必要に応じて変更できます。これにより、ドキュメント内の表の位置を維持しながら、時間を節約し手作業を減らします。 Aspose.PDF Cloud Node.js SDKを使用して表を抽出するためにPDFドキュメントを解析します。

Node.js SDKでできること

  • PDFドキュメントのヘッダーとフッターをテキストまたは画像形式で追加。
  • PDFドキュメントに表とテキストまたは画像スタンプを追加。
  • 複数のPDFドキュメントを既存のファイルに追加。
  • PDF添付ファイル、注釈、フォームフィールドを操作。
  • PDFドキュメントに暗号化や復号化を適用し、パスワードを設定。
  • ページまたはPDFドキュメント全体からすべてのスタンプと表を削除。
  • PDFドキュメントからIDで特定のスタンプまたは表を削除。
  • PDFページまたはドキュメント全体からのテキストの単一または複数のインスタンスを置き換え。
  • PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
  • PDFファイルのさまざまな要素を抽出し、PDFドキュメントを最適化。
  • 機能をテストするための無料アプリを試すことができます。

  •