Trích xuất Bảng từ PDF trong Node.js SDK
API cho việc làm việc với Bảng trong tài liệu PDF sử dụng Cloud Node.js SDK
Get StartedCách lấy Bảng từ PDF qua Node.js SDK
Để lấy Bảng từ PDF, chúng ta sẽ sử dụng Aspose.PDF Cloud Node.js SDK. SDK Cloud này hỗ trợ các lập trình viên Node.js phát triển các ứng dụng tạo, chú thích, chỉnh sửa và chuyển đổi PDF dựa trên đám mây bằng ngôn ngữ lập trình Node.js qua Aspose.PDF REST API. Chỉ cần tạo tài khoản tại Aspose for Cloud và nhận thông tin ứng dụng của bạn. Khi có App SID & key, bạn đã sẵn sàng sử dụng Aspose.PDF Cloud Node.js SDK.
Lệnh Console Trình quản lý Gói
npm install asposepdfcloud --save
Các bước để lấy Bảng từ PDF qua Cloud Node.js
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng tải và lấy Bảng từ PDF chỉ với vài dòng mã.
- Đọc tệp PDF cục bộ.
- Tải lên một PDF cục bộ lên Aspose Cloud.
- Truy xuất và hiển thị tất cả các bảng được phát hiện.
- Truy xuất và hiển thị một bảng theo ID của nó.
- Tải xuống tệp PDF đã cập nhật từ lưu trữ Aspose PDF Cloud.
Lấy Bảng từ PDF bằng Node.js
import credentials from "../../../../Credentials/credentials.json" with { type: "json" };
import fs from 'node:fs/promises';
import path from 'node:path';
import { PdfApi } from "../../../src/api/api.js";
const configParams = {
LOCAL_FOLDER: "C:\\Samples\\",
PDF_DOCUMENT_NAME: "sample.pdf",
PAGE_NUMBER: 2, // Your document page number...
TABLE_ID: "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA", // Your table id...
};
const pdfApi = new PdfApi(credentials.id, credentials.key);
const pdfTables = {
async uploadDocument () {
const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
const pdfFileData = await fs.readFile(fileNamePath);
await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
},
async getAllTables () {
const resultTabs = await pdfApi.getDocumentTables(configParams.PDF_DOCUMENT_NAME);
if (resultTabs.body.code == 200 && resultTabs.body.tables) {
if (!Array.isArray(resultTabs.body.tables.list) || resultTabs.body.tables.list.length === 0) {
throw new Error("Unexpected error : tables is null or empty!!!");
}
this.showTablesInfo(resultTabs.body.tables.list, "All tables");
return resultTabs.body.tables.list;
}
else
console.error("Unexpected error : can't get links!!!");
},
async getTableById () {
const resultTabs = await pdfApi.getTable(configParams.PDF_DOCUMENT_NAME, configParams.TABLE_ID);
if (resultTabs.body.code == 200 && resultTabs.body.table) {
this.showTablesInfo( [ resultTabs.body.table ], "Table by Id");
return resultTabs.body.table;
}
else
console.error("Unexpected error : can't get links!!!");
},
showTablesInfo(tables, prefix) {
if (Array.isArray(tables) && tables.length > 0)
{
tables.forEach(function(table) {
console.log(prefix +" => id: '" + table.id + "', page: '" + table.pageNum + "', rows: '" + table.rowList.length + "', columns: '" + table.rowList[0].cellList.length + "'");
});
}
else
console.error("showBoormarks() error: array of tables is empty!")
},
}
async function main() {
try {
await pdfTables.uploadDocument();
await pdfTables.getAllTables();
await pdfTables.getTableById();
} catch (error) {
console.error("Error:", error.message);
}
}
Lấy Bảng từ PDF
Trích xuất bảng từ tài liệu PDF là điều cần thiết để chuyển đổi nội dung tĩnh, không có cấu trúc thành dữ liệu có cấu trúc, có thể sử dụng. Nó cho phép phân tích dữ liệu hiệu quả, tự động hóa, tích hợp với các hệ thống kinh doanh và chuyển đổi số. Quá trình này tiết kiệm thời gian, cải thiện độ chính xác, hỗ trợ xử lý tài liệu quy mô lớn và cho phép tái sử dụng dữ liệu dễ dàng trong các báo cáo, ứng dụng và kiểm toán. Trích xuất Bảng từ tài liệu PDF với Aspose.PDF Cloud Node.js SDK.
Với thư viện Node.js của chúng tôi, bạn có thể:
- Thêm tiêu đề & chân trang của tài liệu PDF ở định dạng văn bản hoặc hình ảnh.
- Thêm bảng & con dấu (văn bản hoặc hình ảnh) vào tài liệu PDF.
- Ghép nhiều tài liệu PDF vào tệp hiện có.
- Làm việc với các tệp đính kèm, chú thích & các trường mẫu của PDF.
- Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
- Xóa tất cả các con dấu & bảng từ một trang hoặc toàn bộ tài liệu PDF.
- Xóa một con dấu hoặc bảng cụ thể từ tài liệu PDF theo ID của nó.
- Thay thế một hoặc nhiều trường hợp văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
- Hỗ trợ mở rộng cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác nhau.
- Trích xuất các yếu tố khác nhau của tệp PDF & tối ưu hóa tài liệu PDF.
- Bạn có thể thử ứng dụng miễn phí của chúng tôi để trích xuất Bảng vào các tệp PDF trực tuyến và kiểm tra chức năng.
- Tài nguyên Học tập
- Tài liệu
- Mã Nguồn
- Tài liệu tham khảo API
- Hỗ trợ sản phẩm
- Hỗ trợ miễn phí
- Hỗ trợ trả phí
- Blog
- Tại sao chọn Aspose.PDF Cloud cho Node.js?
- Danh sách khách hàng
- Bảo mật