HTML JPG PDF XML DOCX
  Product Family
PDF

Phân tích PDF để trích xuất các trường Biểu mẫu dưới dạng XML trong Node.js SDK

API để phân tích tài liệu PDF nhằm trích xuất các trường Biểu mẫu dưới dạng XML sử dụng API Node.js phía máy chủ.

Get Started

Cách phân tích tài liệu PDF để trích xuất các trường Biểu mẫu dưới dạng XML sử dụng Cloud Node.js SDK

Để phân tích tài liệu PDF nhằm trích xuất các trường Biểu mẫu dưới dạng XML qua Cloud Node.js SDK, chúng tôi sẽ sử dụng Aspose.PDF Cloud Node.js SDK Cloud SDK này hỗ trợ lập trình viên Node.js phát triển các ứng dụng tạo, chú thích, chỉnh sửa, chuyển đổi và phân tích PDF dựa trên đám mây sử dụng ngôn ngữ lập trình Node.js qua Aspose.PDF REST API. Chỉ cần tạo một tài khoản tại Aspose for Cloud và nhận thông tin ứng dụng của bạn. Khi bạn có App SID & key, bạn đã sẵn sàng để sử dụng Aspose.PDF Cloud Node.js SDK.

Lệnh trên Console của Trình quản lý Gói


     
    npm install asposepdfcloud --save
     
     

Các bước để phân tích PDF nhằm trích xuất các trường Biểu mẫu dưới dạng XML sử dụng Node.js SDK

Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất các trường Biểu mẫu dưới dạng XML. Các nhà phát triển chỉ cần một vài dòng mã.

  1. Tạo một đối tượng Cấu hình mới với Bí mật và Khóa Ứng dụng của bạn
  2. Tạo một đối tượng để kết nối với API Đám mây
  3. Tải lên tệp tài liệu của bạn
  4. Phân tích tài liệu PDF để trích xuất các trường Biểu mẫu dưới dạng XML trong lưu trữ đám mây sử dụng hàm putExportFieldsFromPdfToXmlInStorage
  5. Kiểm tra phản hồi và ghi kết quả
  6. Tải xuống tệp XNL cục bộ nếu cần
 

Mã mẫu này hiển thị cách phân tích tài liệu PDF để trích xuất các trường Biểu mẫu dưới dạng XML


import path from 'node:path';

export {ParseExportFormsAsXML};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportFormsAsXML = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    async downloadResult(resultName, localFolder, tempFolder, prefix) {
        const fileName = path.join(tempFolder, resultName);
        const changedPdfData = await pdfApi.downloadFile(fileName);
        const filePath = path.join(localFolder, prefix + resultName);
        await fs.writeFile(filePath, changedPdfData.body);
        console.log("Downloaded: " + filePath);
    },

    async export(documentName, outputXMLName, localFolder, remoteFolder) {
	if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const xmlPath = path.join(remoteFolder, outputXMLName)
            const response = await pdfApi.putExportFieldsFromPdfToXmlInStorage( documentName, xmlPath, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportFormsAsXML(): Pdf document '" + documentName + "' form fields successfully exported to '" + outputXMLName + "' file!");
                await downloadResult(outputXMLName, localFolder, remoteFolder, "");
            }
            else
                console.error("ParseExportFormsAsXML(): Unexpected error!") 

        }
    }
};
 

Làm việc với phân tích Biểu mẫu trong PDF qua Node.js SDK

Bằng cách phân tích tài liệu PDF để trích xuất các trường Biểu mẫu dưới dạng XML, có thể kiểm tra có hệ thống tính hợp lệ và mức độ liên quan của từng trường Biểu mẫu, đảm bảo rằng tất cả các tham chiếu đều hiện tại và có chức năng. Đối với các tác vụ như tải xuống các trường Biểu mẫu dưới dạng XML hoặc thực hiện phân tích hàng loạt, việc trích xuất các trường Biểu mẫu cho phép tự động hóa, tiết kiệm thời gian và giảm công sức thủ công. Phân tích tài liệu PDF để trích xuất các trường Biểu mẫu dưới dạng XML với Aspose.PDF Cloud Node.js SDK.

Với Node.js SDK của chúng tôi, bạn có thể

  • Thêm tiêu đề & chân trang của tài liệu PDF dưới dạng văn bản hoặc hình ảnh.
  • Thêm bảng & tem văn bản hoặc hình ảnh vào tài liệu PDF.
  • Ghép nối nhiều tài liệu PDF vào một tệp hiện có.
  • Làm việc với các tệp đính kèm PDF, chú thích & trường biểu mẫu.
  • Áp dụng mã hóa hoặc giải mã cho tài liệu PDF và đặt mật khẩu.
  • Xóa tất cả tem & bảng từ một trang hoặc toàn bộ tài liệu PDF.
  • Xóa một tem hoặc bảng cụ thể từ tài liệu PDF bằng ID của nó.
  • Thay thế một hoặc nhiều trường hợp văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
  • Hỗ trợ mở rộng cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác.
  • Trích xuất các yếu tố khác nhau của các tệp PDF & tối ưu hóa tài liệu PDF.
  • Bạn có thể thử ứng dụng miễn phí của chúng tôi để kiểm tra tính năng.

  •