HTML JPG PDF XML DOCX
  Product Family
PDF

Node.js SDKでPDFからリンクを抽出

Cloud Node.js SDKを使用してPDFドキュメントからリンクを抽出

Get Started

Node.js SDKを介してPDFからリンクを抽出する方法

PDFからリンクを抽出するには、 Aspose.PDF Cloud Node.js SDKを使用します。このCloud SDKは、Node.jsプログラマーがAspose.PDF REST APIを介してNode.jsプログラミング言語を使用してクラウドベースのPDFクリエーター、アノテーター、エディター、コンバーターアプリを開発するのを支援します。 Aspose for Cloudでアカウントを作成し、アプリケーション情報を取得してください。App SIDとキーを取得したら、Aspose.PDF Cloud Node.js SDKを使用する準備が整います。

パッケージマネージャーコンソールコマンド


     
    npm install asposepdfcloud --save
     
     

Node.jsを使用してリンクを抽出する手順

Aspose.PDF Cloudの開発者は、わずか数行のコードでPDFからリンクを簡単にロードして取得できます。

  1. Pdf.Cloud APIに接続するオブジェクトを作成
  2. ドキュメントファイルをアップロード
  3. getPageLinkAnnotation()関数を使用してドキュメントから必要なリンク注釈を取得
  4. ドキュメントからリンク注釈を正常に取得した後にアクションを実行
  5. 必要に応じて結果をダウンロード
 

Node.jsを使用してPDFからリンクを抽出


 
    import credentials from "./credentials.json"  with { type: "json" };    // json-file in this format: { "id": "*****", "key": "*******" }
    import fs from 'node:fs/promises';
    import path from "node:path";
    import { PdfApi } from "asposepdfcloud";

    const configParams = {
        LOCAL_FOLDER: "C:\\Samples\\",
        PDF_DOCUMENT_NAME: "sample.pdf",
        LOCAL_RESULT_DOCUMENT_NAME: "output_sample.pdf",
        PAGE_NUMBER: 2,         // Your document page number...
        LINK_FIND_ID: "GI5UO32UN5KVESKBMN2GS33OHMZTEMJMGUYDQLBTGYYCYNJSGE",
    };

    const pdfApi = new PdfApi(credentials.id, credentials.key);

    const pdfLinks = {
        async uploadDocument() {
            const pdfFilePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
            const pdfFileData = await fs.readFile(pdfFilePath);
            await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
        },
            
        async getAllLinks () {
            const resultLinks = await pdfApi.getPageLinkAnnotations(configParams.PDF_DOCUMENT_NAME, configParams.PAGE_NUMBER);

            if (resultLinks.body.code == 200 && resultLinks.body.links.list) {
                this.showLinks(resultLinks.body.links.list, "all");
                return resultLinks.body.links.list;
            }
            else
                console.Error("Unexpected error : can't get links!!!");
        },
        
        showLinks (links, prefix) {
            if (Array.isArray(links) && links.length > 0)
            {
                links.forEach(function(link) {
                    console.log(prefix +" => '" + link.id + "', '" + link.action);
                });
            }
        },
    }

    async function main() {
        try {
            await pdfLinks.uploadDocument();
            await pdfLinks.getAllLinks();
        } catch (error) {
            console.error("Error:", error.message);
        }
    };
 

PDF内のリンクを操作

リンクを抽出することで、各URLの有効性と関連性を体系的に検証し、すべての参照が最新で機能していることを確認できます。リンクされたドキュメントのダウンロードやバッチ分析の実施といったタスクのために、URLを抽出することで自動化が可能となり、時間を節約し手作業を削減します。 Aspose.PDF Cloud Node.js SDKを使用してPDFドキュメントからリンクを抽出します。

Node.jsライブラリを使用して次のことができます:

  • PDFドキュメントのヘッダーとフッターをテキストまたは画像形式で追加。
  • PDFドキュメントにテーブルとスタンプ(テキストまたは画像)を追加。
  • 複数のPDFドキュメントを既存のファイルに追加。
  • PDFの添付ファイル、注釈、フォームフィールドを操作。
  • PDFドキュメントに暗号化や復号を適用し、パスワードを設定。
  • ページまたはPDFドキュメント全体からすべてのスタンプとテーブルを削除。
  • PDFドキュメントからIDで特定のスタンプまたはテーブルを削除。
  • PDFページまたはドキュメント全体から単一または複数のテキストインスタンスを置換。
  • PDFドキュメントをさまざまな他のファイル形式に変換するための広範なサポート。
  • PDFファイルのさまざまな要素を抽出し、PDFドキュメントを最適化。
  • 機能をオンラインでテストするために無料アプリを試すことができます。