HTML
JPG
PDF
XML
DOCX
PDF
如何通过 Node.js SDK 提取 PDF 页面
为了从 PDF 提取页面,我们将使用 Aspose.PDF Cloud Node.js SDK。此云 SDK 帮助 Node.js 程序员使用 Aspose.PDF REST API 开发基于云的 PDF 创建、注释、编辑和转换应用程序。只需在 Aspose for Cloud 创建一个帐户并获取您的应用程序信息。一旦您拥有了 App SID 和密钥,您就可以使用 Aspose.PDF Cloud Node.js SDK。
包管理器控制台命令
npm install asposepdfcloud --save
通过云端 Node.js 提取页面的步骤
Aspose.PDF Cloud 开发人员可以通过简单的几行代码轻松从 PDF 中提取页面。
- 创建一个对象以连接到 Pdf.Cloud API
- 上传您的文档文件
- 下载修改后的 PDF 文档
- 检索 PDF 中所有页面的信息
- 检索特定页面的信息
- 在控制台中显示页面信息
此示例代码展示了使用 Node.js 提取页面
import credentials from "./credentials.json" with { type: "json" };
import fs from 'node:fs/promises';
import path from 'node:path';
import { PdfApi } from "asposepdfcloud";
const configParams = {
LOCAL_FOLDER: "C:\\Samples\\",
PDF_DOCUMENT_NAME: "sample.pdf",
LOCAL_RESULT_DOCUMENT_NAME: "output_sample.pdf",
PAGE_NUMBER: 2, // Your document page number...
};
const pdfApi = new PdfApi(credentials.id, credentials.key);
const pdfPages = {
async uploadDocument () {
const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
const pdfFileData = await fs.readFile(fileNamePath);
await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
},
async downloadResult () {
const changedPdfData = await pdfApi.downloadFile(configParams.PDF_DOCUMENT_NAME);
const filePath = path.join(configParams.LOCAL_FOLDER, configParams.LOCAL_RESULT_DOCUMENT_NAME);
await fs.writeFile(filePath, changedPdfData.body);
console.log("Downloaded: " + filePath);
},
async getPagesInfo () {
const resultPages = await pdfApi.getPages(configParams.PDF_DOCUMENT_NAME);
if (resultPages.body.code == 200 && resultPages.body.pages.list) {
this.showPages(resultPages.body.pages.list, "pages");
return resultPages.body.pages.list;
}
else
console.error("Unexpected error : can't get pages!!!");
},
async getPageInfo (pageNumber) {
const resultPages = await pdfApi.getPage(configParams.PDF_DOCUMENT_NAME, pageNumber);
if (resultPages.body.code == 200 && resultPages.body.page) {
this.showPages( [ resultPages.body.page ], "page");
return resultPages.body.page;
}
else
console.error("Unexpected error : can't get pages!!!");
},
showPages (pages, prefix) {
if (Array.isArray(pages) && pages.length > 0)
{
pages.forEach(function(page) {
console.log(prefix +" => id: '" + page.id + "', lLx: '" + page.rectangle.lLX + "', lLY: '" + page.rectangle.lLY + "', uRX: '" + page.rectangle.uRX + "', uRY: '" + page.rectangle.uRY + "'");
});
}
else
console.error("showPages() error: array of pages is empty!")
},
}
async function main() {
try {
await pdfPages.uploadDocument();
await pdfPages.getPagesInfo();
await pdfPages.getPageInfo(configParams.PAGE_NUMBER);
} catch (error) {
console.error("Error:", error.message);
}
}
通过 Node.js SDK 处理 PDF 中的页面
从 PDF 提取页面是一个常见任务,适用于不同环境中的各种目的。此过程涉及从较大文档中选择特定页面以创建新的独立 PDF 文件。了解此操作背后的原因有助于有效管理和利用 PDF 文档。大型 PDF 文件在共享或存储时可能很麻烦。通过仅提取必要的页面,用户可以创建更小、更易于管理的文件。这对于仅有一部分文档与特定目的相关的情况特别有用。例如,删除不必要的页面可以显著减少文件大小,使其更易于处理和分发。 提取页面允许用户将内容重新用于不同的应用程序。例如,可以从综合报告中提取页面以创建独立的摘要或隔离特定数据进行分析。这使得可以重复使用现有内容,而无需从头开始重新创建信息。使用 Aspose.PDF Cloud Node.js SDK 从 PDF 文档中提取页面。
使用我们的 Node.js 库,您可以
- 以文本或图像格式添加 PDF 文档的页眉和页脚。
- 向 PDF 文档添加表格和印章(文本或图像)。
- 将多个 PDF 文档追加到现有文件中。
- 处理 PDF 附件、注释和表单字段。
- 对 PDF 文档进行加密或解密并设置密码。
- 从页面或整个 PDF 文档中删除所有印章和表格。
- 通过其 ID 从 PDF 文档中删除特定印章或表格。
- 替换 PDF 页面或整个文档中的单个或多个文本实例。
- 广泛支持将 PDF 文档转换为各种其他文件格式。
- 提取 PDF 文件的各种元素并优化 PDF 文档。
- 您可以试用我们的免费应用在线测试功能。