HTML JPG PDF XML DOCX
  Product Family
PDF

解析 PDF 以提取表单字段为 XML 在 Node.js SDK 中

通过服务器端 Node.js API 解析 PDF 文档以提取表单字段为 XML 的 API。

Get Started

如何使用 Cloud Node.js SDK 解析 PDF 文档以提取表单字段为 XML

为了通过 Cloud Node.js SDK 解析 PDF 文档以提取表单字段为 XML,我们将使用 Aspose.PDF Cloud Node.js SDK 此 Cloud SDK 协助 Node.js 程序员使用 Aspose.PDF REST API 开发基于云的 PDF 创建、注释、编辑、转换和解析应用。只需在 Aspose for Cloud 创建一个帐户并获取您的应用信息。一旦您拥有了 App SID 和密钥,您就可以开始使用 Aspose.PDF Cloud Node.js SDK。

包管理器控制台命令


     
    npm install asposepdfcloud --save
     
     

使用 Node.js SDK 解析 PDF 以提取表单字段为 XML 的步骤

Aspose.PDF Cloud 开发人员可以轻松解析 PDF 文档以提取表单字段为 XML。开发人员只需几行代码。

  1. 使用您的应用程序密钥创建一个新的配置对象
  2. 创建一个对象以连接到 Cloud API
  3. 上传您的文档文件
  4. 使用 putExportFieldsFromPdfToXmlInStorage 函数在云存储中解析 PDF 文档以提取表单字段为 XML
  5. 检查响应并记录结果
  6. 如有需要,下载本地的 XML 文件
 

此示例代码显示解析 PDF 文档以提取表单字段为 XML


import path from 'node:path';

export {ParseExportFormsAsXML};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportFormsAsXML = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    async downloadResult(resultName, localFolder, tempFolder, prefix) {
        const fileName = path.join(tempFolder, resultName);
        const changedPdfData = await pdfApi.downloadFile(fileName);
        const filePath = path.join(localFolder, prefix + resultName);
        await fs.writeFile(filePath, changedPdfData.body);
        console.log("Downloaded: " + filePath);
    },

    async export(documentName, outputXMLName, localFolder, remoteFolder) {
	if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const xmlPath = path.join(remoteFolder, outputXMLName)
            const response = await pdfApi.putExportFieldsFromPdfToXmlInStorage( documentName, xmlPath, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportFormsAsXML(): Pdf document '" + documentName + "' form fields successfully exported to '" + outputXMLName + "' file!");
                await downloadResult(outputXMLName, localFolder, remoteFolder, "");
            }
            else
                console.error("ParseExportFormsAsXML(): Unexpected error!") 

        }
    }
};
 

通过 Node.js SDK 处理 PDF 中的表单解析

通过解析 PDF 文档以提取表单字段为 XML,可以系统地验证每个表单字段的有效性和相关性,确保所有引用都是当前且功能正常的。对于如下载表单字段为 XML 或进行批量分析等任务,提取表单字段可以实现自动化,节省时间并减少人工工作。 使用 Aspose.PDF Cloud Node.js SDK 解析 PDF 文档以提取表单字段为 XML。

使用我们的 Node.js SDK,您可以

  • 添加 PDF 文档的文本或图像格式的页眉和页脚。
  • 向 PDF 文档添加表格和文本或图像印章。
  • 将多个 PDF 文档附加到现有文件中。
  • 处理 PDF 附件、注释和表单字段。
  • 对 PDF 文档应用加密或解密并设置密码。
  • 从页面或整个 PDF 文档中删除所有印章和表格。
  • 根据 ID 从 PDF 文档中删除特定的印章或表格。
  • 替换 PDF 页面或整个文档中的单个或多个文本实例。
  • 广泛支持将 PDF 文档转换为各种其他文件格式。
  • 提取 PDF 文件的各种元素并优化 PDF 文档。
  • 您可以试用我们的 免费应用 来测试功能。

  •