HTML JPG PDF XML DOCX
  Product Family
PDF

Node.js SDKで名前でテキストを抽出するためのPDFを解析

サーバーサイドNode.js APIを使用して、名前でテキストを抽出するためのPDFドキュメントを解析するAPI。

Get Started

Cloud Node.js SDKを使用して名前でテキストを抽出するためのPDFドキュメントを解析する方法

Cloud Node.js SDKを介して名前でテキストを抽出するためにPDFドキュメントを解析するには、 Aspose.PDF Cloud Node.js SDK このCloud SDKは、Node.jsプログラマーがNode.jsプログラミング言語を使用してクラウドベースのPDFクリエーター、アノテーター、エディター、コンバーター、パーサーアプリを開発するのを支援します。 Aspose for Cloudでアカウントを作成し、アプリケーション情報を取得してください。App SIDとキーが揃ったら、Aspose.PDF Cloud Node.js SDKを使い始める準備が整います。

パッケージマネージャーコンソールコマンド


     
    npm install asposepdfcloud --save
     
     

Node.js SDKを使用して名前でテキストを抽出するためのPDFを解析する手順

Aspose.PDF Cloud開発者は、名前でテキストを抽出するためにPDFドキュメントを簡単に解析できます。開発者はほんの数行のコードが必要です。

  1. アプリケーションシークレットとキーを使用して新しいConfigurationオブジェクトを作成
  2. クラウドAPIに接続するオブジェクトを作成
  3. ドキュメントファイルをアップロード
  4. getTextBoxField関数を使用してクラウドストレージで名前でテキストを抽出するためにPDFドキュメントを解析
  5. 応答を確認し、結果をログに記録
  6. 必要に応じて、JSONファイルとしてローカルにテーブル情報をダウンロード
 

このサンプルコードは、名前でテキストを抽出するためにPDFドキュメントを解析する方法を示しています


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTextBox};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTextBox = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, textboxName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getTextBoxField(documentName, textboxName, null, remoteFolder);
            if (response.body.code == 200) {
                console.log("ParseExportTextBox(): TextBox Filed successfully extracted!");
         	const result = JSON.stringify(response.boby.field);
                const filePath = path.join(localFolder, "parsed_text_box_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTextBox(): Unexpected error!") 

        }
    }
};
 

Node.js SDKを介してPDFでテキスト解析を行う

名前でテキストを抽出するためにPDFドキュメントを解析することにより、必要に応じてTextBoxフィールドの内容を変更できます。これにより、文書内のテキストの位置を維持しながら、時間を節約し、手作業を減らします。 Aspose.PDF Cloud Node.js SDKを使用して、名前でテキストを抽出するためにPDFドキュメントを解析します。

Node.js SDKでできること

  • PDFドキュメントのヘッダーとフッターをテキストまたは画像形式で追加します。
  • PDFドキュメントにテーブルとテキストまたは画像スタンプを追加します。
  • 複数のPDFドキュメントを既存のファイルに追加します。
  • PDFの添付ファイル、注釈、フォームフィールドを操作します。
  • PDFドキュメントに暗号化または復号化を適用し、パスワードを設定します。
  • ページまたはPDFドキュメント全体からすべてのスタンプとテーブルを削除します。
  • IDで指定されたPDFドキュメントから特定のスタンプまたはテーブルを削除します。
  • PDFページまたは文書全体から単一または複数のテキストインスタンスを置き換えます。
  • PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
  • PDFファイルのさまざまな要素を抽出し、PDFドキュメントを最適化します。
  • 機能をテストするために無料アプリをお試しください。

  •