Phân Tích PDF để Trích Xuất Bảng trong Node.js SDK
API để phân tích tài liệu PDF nhằm trích xuất bảng bằng cách sử dụng API Node.js phía máy chủ.
Get StartedCách phân tích tài liệu PDF để trích xuất bảng sử dụng Cloud Node.js SDK
Để phân tích tài liệu PDF nhằm trích xuất bảng qua Cloud Node.js SDK, chúng ta sẽ sử dụng Aspose.PDF Cloud Node.js SDK Cloud SDK này hỗ trợ lập trình viên Node.js trong việc phát triển các ứng dụng tạo, chú thích, chỉnh sửa, chuyển đổi và phân tích PDF dựa trên đám mây sử dụng ngôn ngữ lập trình Node.js thông qua Aspose.PDF REST API. Chỉ cần tạo tài khoản tại Aspose for Cloud và nhận thông tin ứng dụng của bạn. Khi đã có App SID & key, bạn đã sẵn sàng sử dụng Aspose.PDF Cloud Node.js SDK.
Lệnh Console của Trình Quản Lý Gói
npm install asposepdfcloud --save
Các bước để phân tích PDF nhằm trích xuất bảng sử dụng Node.js SDK
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất bảng. Các nhà phát triển chỉ cần vài dòng mã.
- Tạo một đối tượng Cấu Hình mới với Bí Mật Ứng Dụng và Khóa của bạn
- Tạo một đối tượng để kết nối với API Đám Mây
- Tải lên tệp tài liệu của bạn
- Phân tích tài liệu PDF để trích xuất bảng trong lưu trữ đám mây bằng cách sử dụng hàm getDocumentTables
- Kiểm tra phản hồi và ghi lại kết quả
- Tải thông tin bảng xuống tệp JSON cục bộ nếu cần
Mã mẫu này cho thấy cách phân tích tài liệu PDF để trích xuất bảng
import fs from 'node:fs/promises';
import path from 'node:path';
export {ParseExportTables};
const pdfApi = new PdfApi(APP_SID, APP_KEY);
const ParseExportTables = {
async uploadDocument (documentName, localFolder, tempFolder) {
const fileNamePath = path.join(localFolder, documentName);
const fileData = await fs.readFile(fileNamePath);
const storagePath = path.join(tempFolder, documentName);
await pdfApi.uploadFile(storagePath, fileData)
.then(() => console.log("File: '" + documentName +"' successfully uploaded."));
},
async export(documentName, localFolder, remoteFolder) {
if ( pdfApi ) {
await uploadDocument(documentName, localFolder, remoteFolder);
const response = await pdfApi.getDocumentTables( documentName, null, remoteFolder );
if (response.body.code == 200) {
console.log("ParseExportTables(): Tables successfully extracted!");
var result = "[\n";
await Promise.all(
response.body.tables.list.map(async (table) => {
const responseTable = await pdfApi.getTable(documentName, table.id, null, remoteFolder)
.then(function(responseTable){
result += JSON.stringify(table) + ",\n\n";
});
})
);
result += "]";
const filePath = path.join(localFolder, "parsed_tables_output.json");
await fs.writeFile(filePath, result);
console.log("Downloaded: " + filePath);
}
else
console.error("ParseExportTables(): Unexpected error!")
}
}
};
Làm việc với việc phân tích bảng trong PDF qua Node.js SDK
Bằng cách phân tích tài liệu PDF để trích xuất bảng, bạn có thể chỉnh sửa nội dung bảng theo nhu cầu. Việc này duy trì vị trí của bảng trong tài liệu trong khi tiết kiệm thời gian và giảm bớt công việc thủ công. Phân tích tài liệu PDF để trích xuất bảng với Aspose.PDF Cloud Node.js SDK.
Với SDK Node.js của chúng tôi, bạn có thể
- Thêm tiêu đề & chân trang cho tài liệu PDF ở định dạng văn bản hoặc hình ảnh.
- Thêm bảng & dấu văn bản hoặc hình ảnh vào tài liệu PDF.
- Nối nhiều tài liệu PDF vào một tệp hiện có.
- Làm việc với tệp đính kèm PDF, chú thích, & trường biểu mẫu.
- Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
- Xóa tất cả dấu & bảng từ một trang hoặc toàn bộ tài liệu PDF.
- Xóa một dấu hoặc bảng cụ thể từ tài liệu PDF theo ID của nó.
- Thay thế một hoặc nhiều lần xuất hiện của văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
- Hỗ trợ mở rộng cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác nhau.
- Trích xuất nhiều phần tử của tệp PDF & tối ưu hóa tài liệu PDF.
- Bạn có thể thử ứng dụng miễn phí của chúng tôi để kiểm tra chức năng.
- Tài Nguyên Học Tập
- Tài Liệu
- Mã Nguồn
- Tham Khảo API
- Hỗ Trợ Sản Phẩm
- Hỗ Trợ Miễn Phí
- Hỗ Trợ Trả Phí
- Blog
- Tại Sao Chọn Aspose.PDF Cloud cho Node.js?
- Danh Sách Khách Hàng
- Bảo Mật