HTML
JPG
PDF
XML
DOCX
PDF
如何使用 Cloud Node.js SDK 解析 PDF 文档以提取表格
为了通过 Cloud Node.js SDK 解析 PDF 文档以提取表格,我们将使用 Aspose.PDF Cloud Node.js SDK 此 Cloud SDK 协助 Node.js 程序员开发基于云的 PDF 创建、注释、编辑、转换和解析应用程序,使用 Node.js 编程语言通过 Aspose.PDF REST API。只需在 Aspose for Cloud 创建一个帐户并获取您的应用程序信息。一旦您拥有 App SID 和密钥,您就可以准备好使用 Aspose.PDF Cloud Node.js SDK。
Package Manager Console Command
npm install asposepdfcloud --save
使用 Node.js SDK 解析 PDF 以提取表格的步骤
Aspose.PDF Cloud 开发人员可以轻松解析 PDF 文档以提取表格。开发人员只需几行代码。
- 使用您的应用程序密钥和密钥创建一个新的 Configuration 对象
- 创建一个对象以连接到 Cloud API
- 上传您的文档文件
- 使用 getDocumentTables 函数在云存储中解析 PDF 文档以提取表格
- 检查响应并记录结果
- 如有需要,将表格信息下载为本地 JSON 文件
此示例代码展示了如何解析 PDF 文档以提取表格
import fs from 'node:fs/promises';
import path from 'node:path';
export {ParseExportTables};
const pdfApi = new PdfApi(APP_SID, APP_KEY);
const ParseExportTables = {
async uploadDocument (documentName, localFolder, tempFolder) {
const fileNamePath = path.join(localFolder, documentName);
const fileData = await fs.readFile(fileNamePath);
const storagePath = path.join(tempFolder, documentName);
await pdfApi.uploadFile(storagePath, fileData)
.then(() => console.log("File: '" + documentName +"' successfully uploaded."));
},
async export(documentName, localFolder, remoteFolder) {
if ( pdfApi ) {
await uploadDocument(documentName, localFolder, remoteFolder);
const response = await pdfApi.getDocumentTables( documentName, null, remoteFolder );
if (response.body.code == 200) {
console.log("ParseExportTables(): Tables successfully extracted!");
var result = "[\n";
await Promise.all(
response.body.tables.list.map(async (table) => {
const responseTable = await pdfApi.getTable(documentName, table.id, null, remoteFolder)
.then(function(responseTable){
result += JSON.stringify(table) + ",\n\n";
});
})
);
result += "]";
const filePath = path.join(localFolder, "parsed_tables_output.json");
await fs.writeFile(filePath, result);
console.log("Downloaded: " + filePath);
}
else
console.error("ParseExportTables(): Unexpected error!")
}
}
};
通过 Node.js SDK 处理 PDF 中的表格解析
通过解析 PDF 文档以提取表格,您可以根据需要修改表格的内容。这保持了表格在文档中的位置,同时节省了时间并减少了手动工作。 使用 Aspose.PDF Cloud Node.js SDK 解析 PDF 文档以提取表格。
使用我们的 Node.js SDK,您可以
- 以文本或图像格式添加 PDF 文档的页眉和页脚。
- 向 PDF 文档添加表格及文本或图像印章。
- 将多个 PDF 文档附加到现有文件。
- 处理 PDF 附件、注释和表单字段。
- 对 PDF 文档应用加密或解密并设置密码。
- 从页面或整个 PDF 文档中删除所有印章和表格。
- 按 ID 从 PDF 文档中删除特定印章或表格。
- 在 PDF 页面或整个文档中替换单个或多个文本实例。
- 广泛支持将 PDF 文档转换为各种其他文件格式。
- 提取 PDF 文件的各种元素并优化 PDF 文档。
- 您可以尝试我们的 免费应用 来测试功能。