HTML JPG PDF XML DOCX
  Product Family
PDF

在 Node.js SDK 中从 PDF 提取链接

使用云端 Node.js SDK 从 PDF 文档中提取链接

Get Started

如何通过 Node.js SDK 从 PDF 提取链接

要从 PDF 中提取链接,我们将使用 Aspose.PDF Cloud Node.js SDK。该云端 SDK 帮助 Node.js 程序员使用 Node.js 编程语言通过 Aspose.PDF REST API 开发基于云的 PDF 创建、注释、编辑和转换应用程序。只需在 Aspose for Cloud 创建一个帐户并获取您的应用程序信息。一旦您拥有了 App SID 和密钥,您就可以开始使用 Aspose.PDF Cloud Node.js SDK。

包管理器控制台命令


     
    npm install asposepdfcloud --save
     
     

使用 Node.js 提取链接的步骤

Aspose.PDF Cloud 开发人员可以轻松地在几行代码中加载并获取 PDF 中的链接。

  1. 创建一个对象以连接到 Pdf.Cloud API
  2. 上传您的文档文件
  3. 使用 getPageLinkAnnotation() 函数从文档中检索所需的链接注释
  4. 成功检索文档中的链接注释后执行一些操作
  5. 如有需要,下载结果
 

使用 Node.js 从 PDF 中提取链接


 
    import credentials from "./credentials.json"  with { type: "json" };    // json-file in this format: { "id": "*****", "key": "*******" }
    import fs from 'node:fs/promises';
    import path from "node:path";
    import { PdfApi } from "asposepdfcloud";

    const configParams = {
        LOCAL_FOLDER: "C:\\Samples\\",
        PDF_DOCUMENT_NAME: "sample.pdf",
        LOCAL_RESULT_DOCUMENT_NAME: "output_sample.pdf",
        PAGE_NUMBER: 2,         // Your document page number...
        LINK_FIND_ID: "GI5UO32UN5KVESKBMN2GS33OHMZTEMJMGUYDQLBTGYYCYNJSGE",
    };

    const pdfApi = new PdfApi(credentials.id, credentials.key);

    const pdfLinks = {
        async uploadDocument() {
            const pdfFilePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
            const pdfFileData = await fs.readFile(pdfFilePath);
            await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
        },
            
        async getAllLinks () {
            const resultLinks = await pdfApi.getPageLinkAnnotations(configParams.PDF_DOCUMENT_NAME, configParams.PAGE_NUMBER);

            if (resultLinks.body.code == 200 && resultLinks.body.links.list) {
                this.showLinks(resultLinks.body.links.list, "all");
                return resultLinks.body.links.list;
            }
            else
                console.Error("Unexpected error : can't get links!!!");
        },
        
        showLinks (links, prefix) {
            if (Array.isArray(links) && links.length > 0)
            {
                links.forEach(function(link) {
                    console.log(prefix +" => '" + link.id + "', '" + link.action);
                });
            }
        },
    }

    async function main() {
        try {
            await pdfLinks.uploadDocument();
            await pdfLinks.getAllLinks();
        } catch (error) {
            console.error("Error:", error.message);
        }
    };
 

在 PDF 中处理链接

通过提取链接,可以系统地验证每个 URL 的有效性和相关性,确保所有引用都是最新的和有效的。对于下载链接文档或进行批量分析等任务,提取 URL 能够实现自动化,节省时间并减少人工工作。 使用 Aspose.PDF Cloud Node.js SDK 从 PDF 文档中提取链接。

使用我们的 Node.js 库,您可以:

  • 以文本或图像格式为 PDF 文档添加页眉和页脚。
  • 向 PDF 文档添加表格和印章(文本或图像)。
  • 将多个 PDF 文档附加到现有文件。
  • 处理 PDF 附件、注释和表单字段。
  • 对 PDF 文档应用加密或解密并设置密码。
  • 删除页面或整个 PDF 文档中的所有印章和表格。
  • 按 ID 删除 PDF 文档中的特定印章或表格。
  • 替换 PDF 页面或整个文档中的单个或多个文本实例。
  • 广泛支持将 PDF 文档转换为各种其他文件格式。
  • 提取 PDF 文件的各种元素并优化 PDF 文档。
  • 您可以试用我们的免费应用在线测试功能。