HTML JPG PDF XML DOCX
  Product Family
PDF

Node.js SDKでPDFからページを抽出

Cloud Node.js SDKを使用してPDFドキュメントからページを抽出

Get Started

Node.js SDKを通じてPDFページを抽出する方法

PDFからページを抽出するために、以下を使用します Aspose.PDF Cloud Node.js SDK。このCloud SDKは、Node.jsプログラマーがNode.jsプログラミング言語を使用してクラウドベースのPDF作成、注釈、編集、および変換アプリを開発するのを支援します。単にAspose for Cloudでアカウントを作成し、アプリケーション情報を取得してください。App SIDとキーを取得したら、Aspose.PDF Cloud Node.js SDKを使用する準備が整います。

パッケージマネージャーコンソールコマンド


     
    npm install asposepdfcloud --save
     
     

Cloud Node.jsを通じてページを抽出する手順

Aspose.PDF Cloud開発者は、ほんの数行のコードで簡単にPDFからページを抽出できます。

  1. Pdf.Cloud APIに接続するオブジェクトを作成する
  2. ドキュメントファイルをアップロードする
  3. 変更されたPDFドキュメントをダウンロードする
  4. PDF内のすべてのページに関する情報を取得する
  5. 特定のページに関する情報を取得する
  6. コンソールにページ情報を表示する
 

このサンプルコードはNode.jsを使用してページを抽出する方法を示しています


    import credentials from "./credentials.json"  with { type: "json" };
    import fs from 'node:fs/promises';
    import path from 'node:path';
    import { PdfApi } from "asposepdfcloud";

    const configParams = {
        LOCAL_FOLDER: "C:\\Samples\\",
        PDF_DOCUMENT_NAME: "sample.pdf",
        LOCAL_RESULT_DOCUMENT_NAME: "output_sample.pdf",
        PAGE_NUMBER: 2,     // Your document page number...
    };

    const pdfApi = new PdfApi(credentials.id, credentials.key);

    const pdfPages = {
        async uploadDocument () {
            const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
            const pdfFileData = await fs.readFile(fileNamePath);
            await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
        },
            
        async downloadResult () {
            const changedPdfData = await pdfApi.downloadFile(configParams.PDF_DOCUMENT_NAME);
            const filePath = path.join(configParams.LOCAL_FOLDER, configParams.LOCAL_RESULT_DOCUMENT_NAME);
            await fs.writeFile(filePath, changedPdfData.body);
            console.log("Downloaded: " + filePath);
        },

        async getPagesInfo () {
            const resultPages = await pdfApi.getPages(configParams.PDF_DOCUMENT_NAME);

            if (resultPages.body.code == 200 && resultPages.body.pages.list) {
                this.showPages(resultPages.body.pages.list, "pages");
                return resultPages.body.pages.list;
            }
            else
                console.error("Unexpected error : can't get pages!!!");
        },

        async getPageInfo (pageNumber) {
            const resultPages = await pdfApi.getPage(configParams.PDF_DOCUMENT_NAME, pageNumber);

            if (resultPages.body.code == 200 && resultPages.body.page) {
                this.showPages( [ resultPages.body.page ], "page");
                return resultPages.body.page;
            }
            else
                console.error("Unexpected error : can't get pages!!!");
        },

        showPages (pages, prefix) {
            if (Array.isArray(pages) && pages.length > 0)
            {
                pages.forEach(function(page) {
                    console.log(prefix +" => id: '" + page.id + "', lLx: '" + page.rectangle.lLX + "', lLY: '" + page.rectangle.lLY + "', uRX: '" + page.rectangle.uRX + "', uRY: '" + page.rectangle.uRY + "'");
                });
            }
            else
                console.error("showPages() error: array of pages is empty!")
        },
    }

    async function main() {
        try {
            await pdfPages.uploadDocument();
            await pdfPages.getPagesInfo();
            await pdfPages.getPageInfo(configParams.PAGE_NUMBER);
        } catch (error) {
            console.error("Error:", error.message);
        }
    }
 

Node.js SDKを通じてPDFのページを操作する

PDFからページを抽出することは、さまざまなコンテキストでさまざまな目的に役立つ一般的なタスクです。このプロセスには、より大きなドキュメントから特定のページを選択して新しい独立したPDFファイルを作成することが含まれます。この実践の背後にある理由を理解することで、PDFドキュメントを効果的に管理および利用するのに役立ちます。大きなPDFファイルは、共有や保存が面倒になることがあります。必要なページのみを抽出することで、ユーザーはより小さくて管理しやすいファイルを作成できます。これは、特定の目的に関連する部分のみが重要な場合に特に便利です。例えば、不要なページを削除することで、ファイルサイズが大幅に減少し、扱いやすく配布しやすくなります。 ページを抽出することで、ユーザーはコンテンツをさまざまなアプリケーションに再利用できます。例えば、包括的なレポートからページを抽出して、独立した要約を作成したり、分析のために特定のデータを分離したりできます。これにより、既存のコンテンツを再作成することなく再利用することが可能になります。PDFドキュメントからページを抽出するには、Aspose.PDF Cloud Node.js SDKを使用します。

Node.jsライブラリを使用すると、次のことができます

  • テキストまたは画像形式でPDFドキュメントのヘッダーとフッターを追加します。
  • PDFドキュメントにテーブルとスタンプ(テキストまたは画像)を追加します。
  • 複数のPDFドキュメントを既存のファイルに追加します。
  • PDFの添付ファイル、注釈、フォームフィールドを操作します。
  • PDFドキュメントに暗号化または復号化を適用し、パスワードを設定します。
  • ページまたはPDFドキュメント全体からすべてのスタンプとテーブルを削除します。
  • IDによってPDFドキュメントから特定のスタンプまたはテーブルを削除します。
  • PDFページまたはドキュメント全体から、単一または複数のテキストのインスタンスを置き換えます。
  • PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
  • PDFファイルのさまざまな要素を抽出し、PDFドキュメントを最適化します。
  • 無料のアプリを試して、オンラインで機能をテストできます。