Trích Xuất Trang từ PDF trong Node.js SDK
Trích Xuất Trang từ Tài liệu PDF sử dụng Cloud Node.js SDK
Get StartedCách Trích Xuất Trang PDF qua Node.js SDK
Để Trích Xuất Trang từ PDF, chúng ta sẽ sử dụng Aspose.PDF Cloud Node.js SDK. SDK Cloud này hỗ trợ các lập trình viên Node.js phát triển các ứng dụng tạo, chú thích, chỉnh sửa và chuyển đổi PDF dựa trên đám mây sử dụng ngôn ngữ lập trình Node.js qua Aspose.PDF REST API. Chỉ cần tạo tài khoản tại Aspose for Cloud và lấy thông tin ứng dụng của bạn. Khi bạn có App SID & key, bạn đã sẵn sàng để sử dụng Aspose.PDF Cloud Node.js SDK.
Lệnh Package Manager Console
npm install asposepdfcloud --save
Các bước để Trích Xuất Trang qua Cloud Node.js
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng Trích Xuất Trang từ PDF chỉ với vài dòng mã.
- Tạo một đối tượng để kết nối với Pdf.Cloud API
- Tải lên tệp tài liệu của bạn
- Tải về tài liệu PDF đã chỉnh sửa
- Truy xuất thông tin về tất cả các trang trong PDF
- Truy xuất thông tin về một trang cụ thể
- Hiển thị thông tin về các trang trong bảng điều khiển
Mã mẫu này cho thấy cách Trích Xuất Trang sử dụng Node.js
import credentials from "./credentials.json" with { type: "json" };
import fs from 'node:fs/promises';
import path from 'node:path';
import { PdfApi } from "asposepdfcloud";
const configParams = {
LOCAL_FOLDER: "C:\\Samples\\",
PDF_DOCUMENT_NAME: "sample.pdf",
LOCAL_RESULT_DOCUMENT_NAME: "output_sample.pdf",
PAGE_NUMBER: 2, // Your document page number...
};
const pdfApi = new PdfApi(credentials.id, credentials.key);
const pdfPages = {
async uploadDocument () {
const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
const pdfFileData = await fs.readFile(fileNamePath);
await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
},
async downloadResult () {
const changedPdfData = await pdfApi.downloadFile(configParams.PDF_DOCUMENT_NAME);
const filePath = path.join(configParams.LOCAL_FOLDER, configParams.LOCAL_RESULT_DOCUMENT_NAME);
await fs.writeFile(filePath, changedPdfData.body);
console.log("Downloaded: " + filePath);
},
async getPagesInfo () {
const resultPages = await pdfApi.getPages(configParams.PDF_DOCUMENT_NAME);
if (resultPages.body.code == 200 && resultPages.body.pages.list) {
this.showPages(resultPages.body.pages.list, "pages");
return resultPages.body.pages.list;
}
else
console.error("Unexpected error : can't get pages!!!");
},
async getPageInfo (pageNumber) {
const resultPages = await pdfApi.getPage(configParams.PDF_DOCUMENT_NAME, pageNumber);
if (resultPages.body.code == 200 && resultPages.body.page) {
this.showPages( [ resultPages.body.page ], "page");
return resultPages.body.page;
}
else
console.error("Unexpected error : can't get pages!!!");
},
showPages (pages, prefix) {
if (Array.isArray(pages) && pages.length > 0)
{
pages.forEach(function(page) {
console.log(prefix +" => id: '" + page.id + "', lLx: '" + page.rectangle.lLX + "', lLY: '" + page.rectangle.lLY + "', uRX: '" + page.rectangle.uRX + "', uRY: '" + page.rectangle.uRY + "'");
});
}
else
console.error("showPages() error: array of pages is empty!")
},
}
async function main() {
try {
await pdfPages.uploadDocument();
await pdfPages.getPagesInfo();
await pdfPages.getPageInfo(configParams.PAGE_NUMBER);
} catch (error) {
console.error("Error:", error.message);
}
}
Làm việc với Các Trang trong PDF qua Node.js SDK
Trích xuất các trang từ một PDF là một nhiệm vụ phổ biến phục vụ nhiều mục đích khác nhau trong các ngữ cảnh khác nhau. Quá trình này liên quan đến việc chọn các trang cụ thể từ một tài liệu lớn hơn để tạo một tệp PDF mới, riêng biệt. Hiểu được lý do đằng sau thực hành này có thể giúp quản lý và sử dụng hiệu quả tài liệu PDF. Các tệp PDF lớn có thể gây phiền toái khi chia sẻ hoặc lưu trữ. Bằng cách chỉ trích xuất các trang cần thiết, người dùng có thể tạo ra các tệp nhỏ hơn, dễ quản lý hơn. Điều này đặc biệt hữu ích khi chỉ một phần của tài liệu có liên quan đến một mục đích cụ thể. Ví dụ, loại bỏ các trang không cần thiết có thể giảm đáng kể kích thước tệp, làm cho nó dễ dàng hơn để xử lý và phân phối. Trích xuất các trang cho phép người dùng tái sử dụng nội dung cho các ứng dụng khác nhau. Ví dụ, một người có thể trích xuất các trang từ một báo cáo toàn diện để tạo một bản tóm tắt độc lập hoặc để cô lập dữ liệu cụ thể cho phân tích. Điều này cho phép tái sử dụng nội dung hiện có mà không cần phải tạo lại thông tin từ đầu. Trích xuất các Trang từ tài liệu PDF với Aspose.PDF Cloud Node.js SDK.
Với thư viện Node.js của chúng tôi, bạn có thể
- Thêm tiêu đề & chân trang của tài liệu PDF ở định dạng văn bản hoặc hình ảnh.
- Thêm bảng & con dấu (văn bản hoặc hình ảnh) vào tài liệu PDF.
- Ghép nhiều tài liệu PDF vào một tệp hiện có.
- Làm việc với các tệp đính kèm PDF, chú thích, & trường biểu mẫu.
- Áp dụng mã hóa hoặc giải mã các tài liệu PDF & đặt mật khẩu.
- Xóa tất cả các con dấu & bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
- Xóa một con dấu hoặc bảng cụ thể khỏi tài liệu PDF theo ID của nó.
- Thay thế một hoặc nhiều trường hợp văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
- Hỗ trợ rộng rãi cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác.
- Trích xuất các yếu tố khác nhau của tệp PDF & tối ưu hóa tài liệu PDF.
- Bạn có thể thử các ứng dụng miễn phí của chúng tôi để kiểm tra chức năng trực tuyến.
- Tài Nguyên Học Tập
- Tài Liệu
- Mã Nguồn
- Tham Khảo API
- Hỗ Trợ Sản Phẩm
- Hỗ Trợ Miễn Phí
- Hỗ Trợ Trả Phí
- Blog
- Tại Sao Chọn Aspose.PDF Cloud cho Node.js?
- Danh Sách Khách Hàng
- Bảo Mật