HTML
JPG
PDF
XML
DOCX
PDF
如何使用Cloud Node.js SDK按名称解析PDF文档以提取文本
为了通过Cloud Node.js SDK按名称解析PDF文档以提取文本,我们将使用 Aspose.PDF Cloud Node.js SDK 此Cloud SDK帮助Node.js程序员使用Aspose.PDF REST API开发基于云的PDF创建、注释、编辑、转换和解析应用程序。只需在Aspose for Cloud创建一个帐户并获取您的应用程序信息。一旦您拥有App SID和密钥,您就可以准备好使用Aspose.PDF Cloud Node.js SDK。
包管理器控制台命令
npm install asposepdfcloud --save
使用Node.js SDK按名称解析PDF以提取文本的步骤
Aspose.PDF Cloud开发人员可以轻松地按名称解析PDF文档以提取文本。开发人员只需几行代码。
- 使用您的应用程序密钥和密钥创建一个新的配置对象
- 创建一个对象以连接到Cloud API
- 上传您的文档文件
- 使用getTextBoxField函数在云存储中按名称解析PDF文档以提取文本
- 检查响应并记录结果
- 如有需要,将表格信息下载为本地JSON文件
此示例代码显示按名称解析PDF文档以提取文本
import fs from 'node:fs/promises';
import path from 'node:path';
export {ParseExportTextBox};
const pdfApi = new PdfApi(APP_SID, APP_KEY);
const ParseExportTextBox = {
async uploadDocument (documentName, localFolder, tempFolder) {
const fileNamePath = path.join(localFolder, documentName);
const fileData = await fs.readFile(fileNamePath);
const storagePath = path.join(tempFolder, documentName);
await pdfApi.uploadFile(storagePath, fileData)
.then(() => console.log("File: '" + documentName +"' successfully uploaded."));
},
async export(documentName, textboxName, localFolder, remoteFolder) {
if ( pdfApi ) {
await uploadDocument(documentName, localFolder, remoteFolder);
const response = await pdfApi.getTextBoxField(documentName, textboxName, null, remoteFolder);
if (response.body.code == 200) {
console.log("ParseExportTextBox(): TextBox Filed successfully extracted!");
const result = JSON.stringify(response.boby.field);
const filePath = path.join(localFolder, "parsed_text_box_output.json");
await fs.writeFile(filePath, result);
console.log("Downloaded: " + filePath);
}
else
console.error("ParseExportTextBox(): Unexpected error!")
}
}
};
通过Node.js SDK处理PDF中的文本解析
通过按名称解析PDF文档以提取文本,您可以根据需要修改TextBox字段的内容。这保持了文档中文本的位置,同时节省了时间并减少了手动工作。 使用Aspose.PDF Cloud Node.js SDK按名称解析PDF文档以提取文本。
使用我们的Node.js SDK,您可以
- 以文本或图像格式添加PDF文档的页眉和页脚。
- 向PDF文档添加表格和文本或图像印章。
- 将多个PDF文档附加到现有文件中。
- 处理PDF附件、注释和表单字段。
- 对PDF文档应用加密或解密并设置密码。
- 从页面或整个PDF文档中删除所有印章和表格。
- 根据ID从PDF文档中删除特定的印章或表格。
- 替换PDF页面或整个文档中的单个或多个文本实例。
- 广泛支持将PDF文档转换为各种其他文件格式。
- 提取PDF文件的各种元素并优化PDF文档。
- 您可以尝试我们的免费应用程序来测试功能。