Phân tích PDF để trích xuất Văn bản trong Node.js SDK
API để phân tích tài liệu PDF nhằm trích xuất văn bản bằng cách sử dụng API Node.js phía máy chủ.
Get StartedCách phân tích tài liệu PDF để trích xuất Văn bản bằng Cloud Node.js SDK
Để phân tích tài liệu PDF để trích xuất Văn bản qua Cloud Node.js SDK , chúng tôi sẽ sử dụng Aspose.PDF Cloud Node.js SDK Cloud SDK này hỗ trợ các lập trình viên Node.js phát triển ứng dụng tạo, chú thích, chỉnh sửa, chuyển đổi và phân tích PDF dựa trên đám mây bằng ngôn ngữ lập trình Node.js thông qua Aspose.PDF REST API. Chỉ cần tạo tài khoản tại Aspose for Cloud và nhận thông tin ứng dụng của bạn. Khi bạn có App SID & key, bạn đã sẵn sàng để sử dụng Aspose.PDF Cloud Node.js SDK.
Lệnh Console của Trình quản lý Gói
npm install asposepdfcloud --save
Các bước để phân tích PDF để trích xuất Văn bản bằng Node.js SDK
Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất Văn bản. Các nhà phát triển chỉ cần vài dòng mã.
- Tạo một đối tượng Cấu hình mới với Bí mật và Khóa Ứng dụng của bạn
- Tạo một đối tượng để kết nối với API Đám mây
- Tải lên tệp tài liệu của bạn
- Phân tích tài liệu PDF để trích xuất Văn bản trong lưu trữ đám mây bằng chức năng getDocumentTextBoxFields
- Kiểm tra phản hồi và ghi lại kết quả
- Tải xuống thông tin hộp Văn bản trong tệp JSON cục bộ nếu cần
Mã mẫu này hiển thị cách phân tích tài liệu PDF để trích xuất Văn bản
import fs from 'node:fs/promises';
import path from 'node:path';
export {ParseExportTextBoxes};
const pdfApi = new PdfApi(APP_SID, APP_KEY);
const ParseExportTextBoxes = {
async uploadDocument (documentName, localFolder, tempFolder) {
const fileNamePath = path.join(localFolder, documentName);
const fileData = await fs.readFile(fileNamePath);
const storagePath = path.join(tempFolder, documentName);
await pdfApi.uploadFile(storagePath, fileData)
.then(() => console.log("File: '" + documentName +"' successfully uploaded."));
},
async export(documentName, localFolder, remoteFolder) {
if ( pdfApi ) {
await uploadDocument(documentName, localFolder, remoteFolder);
const response = await pdfApi.getDocumentTextBoxFields( documentName, null, remoteFolder );
if (response.body.code == 200) {
console.log("ParseExportTextBoxes(): TextBox Fileds successfully extracted!");
var result = "[\n";
await Promise.all(
response.body.fields.list.map(async (textbox) => {
const responseText = await pdfApi.getTextBoxField(documentName, textbox.fullName, null, remoteFolder)
.then(function(responseTextBox){
result += JSON.stringify(textbox) + ",\n\n";
});
})
);
result += "]";
const filePath = path.join(localFolder, "parsed_text_boxes_output.json");
await fs.writeFile(filePath, result);
console.log("Downloaded: " + filePath);
}
else
console.error("ParseExportTextBoxes(): Unexpected error!")
}
}
};
Làm việc với việc phân tích Văn bản trong PDF qua Node.js SDK
Bằng cách phân tích tài liệu PDF để trích xuất văn bản, bạn có thể chỉnh sửa nội dung của các trường TextBox khi cần. Điều này duy trì vị trí của văn bản trong các tài liệu trong khi tiết kiệm thời gian và giảm công việc thủ công. Phân tích tài liệu PDF để trích xuất văn bản với Aspose.PDF Cloud Node.js SDK.
Với Node.js SDK của chúng tôi, bạn có thể
- Thêm tiêu đề & chân trang của tài liệu PDF dưới dạng văn bản hoặc định dạng hình ảnh.
- Thêm bảng & tem văn bản hoặc hình ảnh vào tài liệu PDF.
- Nối nhiều tài liệu PDF vào một tệp hiện có.
- Làm việc với tệp đính kèm PDF, chú thích, & các trường biểu mẫu.
- Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
- Xóa tất cả các tem & bảng từ một trang hoặc toàn bộ tài liệu PDF.
- Xóa một tem hoặc bảng cụ thể khỏi tài liệu PDF theo ID của nó.
- Thay thế một hoặc nhiều lần xuất hiện của văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
- Hỗ trợ rộng rãi cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác nhau.
- Trích xuất nhiều phần tử khác nhau của tệp PDF & tối ưu hóa tài liệu PDF.
- Bạn có thể thử ứng dụng miễn phí của chúng tôi để kiểm tra chức năng.
- Tài Nguyên Học Tập
- Tài Liệu
- Mã Nguồn
- Tham Chiếu API
- Hỗ Trợ Sản Phẩm
- Hỗ Trợ Miễn Phí
- Hỗ Trợ Trả Phí
- Blog
- Tại Sao Chọn Aspose.PDF Cloud cho Node.js?
- Danh Sách Khách Hàng
- Bảo Mật