HTML
JPG
PDF
XML
DOCX
PDF
如何使用 Cloud Node.js SDK 解析 PDF 文档以提取表单字段为 XML
为了通过 Cloud Node.js SDK 解析 PDF 文档以提取表单字段为 XML,我们将使用 Aspose.PDF Cloud Node.js SDK 此 Cloud SDK 协助 Node.js 程序员使用 Aspose.PDF REST API 开发基于云的 PDF 创建、注释、编辑、转换和解析应用。只需在 Aspose for Cloud 创建一个帐户并获取您的应用信息。一旦您拥有了 App SID 和密钥,您就可以开始使用 Aspose.PDF Cloud Node.js SDK。
包管理器控制台命令
npm install asposepdfcloud --save
使用 Node.js SDK 解析 PDF 以提取表单字段为 XML 的步骤
Aspose.PDF Cloud 开发人员可以轻松解析 PDF 文档以提取表单字段为 XML。开发人员只需几行代码。
- 使用您的应用程序密钥创建一个新的配置对象
- 创建一个对象以连接到 Cloud API
- 上传您的文档文件
- 使用 putExportFieldsFromPdfToXmlInStorage 函数在云存储中解析 PDF 文档以提取表单字段为 XML
- 检查响应并记录结果
- 如有需要,下载本地的 XML 文件
此示例代码显示解析 PDF 文档以提取表单字段为 XML
import path from 'node:path';
export {ParseExportFormsAsXML};
const pdfApi = new PdfApi(APP_SID, APP_KEY);
const ParseExportFormsAsXML = {
async uploadDocument (documentName, localFolder, tempFolder) {
const fileNamePath = path.join(localFolder, documentName);
const fileData = await fs.readFile(fileNamePath);
const storagePath = path.join(tempFolder, documentName);
await pdfApi.uploadFile(storagePath, fileData)
.then(() => console.log("File: '" + documentName +"' successfully uploaded."));
},
async downloadResult(resultName, localFolder, tempFolder, prefix) {
const fileName = path.join(tempFolder, resultName);
const changedPdfData = await pdfApi.downloadFile(fileName);
const filePath = path.join(localFolder, prefix + resultName);
await fs.writeFile(filePath, changedPdfData.body);
console.log("Downloaded: " + filePath);
},
async export(documentName, outputXMLName, localFolder, remoteFolder) {
if ( pdfApi ) {
await uploadDocument(documentName, localFolder, remoteFolder);
const xmlPath = path.join(remoteFolder, outputXMLName)
const response = await pdfApi.putExportFieldsFromPdfToXmlInStorage( documentName, xmlPath, null, remoteFolder );
if (response.body.code == 200) {
console.log("ParseExportFormsAsXML(): Pdf document '" + documentName + "' form fields successfully exported to '" + outputXMLName + "' file!");
await downloadResult(outputXMLName, localFolder, remoteFolder, "");
}
else
console.error("ParseExportFormsAsXML(): Unexpected error!")
}
}
};
通过 Node.js SDK 处理 PDF 中的表单解析
通过解析 PDF 文档以提取表单字段为 XML,可以系统地验证每个表单字段的有效性和相关性,确保所有引用都是当前且功能正常的。对于如下载表单字段为 XML 或进行批量分析等任务,提取表单字段可以实现自动化,节省时间并减少人工工作。 使用 Aspose.PDF Cloud Node.js SDK 解析 PDF 文档以提取表单字段为 XML。
使用我们的 Node.js SDK,您可以
- 添加 PDF 文档的文本或图像格式的页眉和页脚。
- 向 PDF 文档添加表格和文本或图像印章。
- 将多个 PDF 文档附加到现有文件中。
- 处理 PDF 附件、注释和表单字段。
- 对 PDF 文档应用加密或解密并设置密码。
- 从页面或整个 PDF 文档中删除所有印章和表格。
- 根据 ID 从 PDF 文档中删除特定的印章或表格。
- 替换 PDF 页面或整个文档中的单个或多个文本实例。
- 广泛支持将 PDF 文档转换为各种其他文件格式。
- 提取 PDF 文件的各种元素并优化 PDF 文档。
- 您可以试用我们的 免费应用 来测试功能。