通过Node.js SDK按名称解析PDF以提取文本

使用服务器端Node.js API按名称解析PDF文档以提取文本的API。

Get Started

如何使用Cloud Node.js SDK按名称解析PDF文档以提取文本

为了通过Cloud Node.js SDK按名称解析PDF文档以提取文本,我们将使用 Aspose.PDF Cloud Node.js SDK 此Cloud SDK帮助Node.js程序员使用Aspose.PDF REST API开发基于云的PDF创建、注释、编辑、转换和解析应用程序。只需在Aspose for Cloud创建一个帐户并获取您的应用程序信息。一旦您拥有App SID和密钥,您就可以准备好使用Aspose.PDF Cloud Node.js SDK。

包管理器控制台命令


     
    npm install asposepdfcloud --save
     
     

使用Node.js SDK按名称解析PDF以提取文本的步骤

Aspose.PDF Cloud开发人员可以轻松地按名称解析PDF文档以提取文本。开发人员只需几行代码。

  1. 使用您的应用程序密钥和密钥创建一个新的配置对象
  2. 创建一个对象以连接到Cloud API
  3. 上传您的文档文件
  4. 使用getTextBoxField函数在云存储中按名称解析PDF文档以提取文本
  5. 检查响应并记录结果
  6. 如有需要,将表格信息下载为本地JSON文件
 

此示例代码显示按名称解析PDF文档以提取文本


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTextBox};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTextBox = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, textboxName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getTextBoxField(documentName, textboxName, null, remoteFolder);
            if (response.body.code == 200) {
                console.log("ParseExportTextBox(): TextBox Filed successfully extracted!");
         	const result = JSON.stringify(response.boby.field);
                const filePath = path.join(localFolder, "parsed_text_box_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTextBox(): Unexpected error!") 

        }
    }
};
 

通过Node.js SDK处理PDF中的文本解析

通过按名称解析PDF文档以提取文本,您可以根据需要修改TextBox字段的内容。这保持了文档中文本的位置,同时节省了时间并减少了手动工作。 使用Aspose.PDF Cloud Node.js SDK按名称解析PDF文档以提取文本。

使用我们的Node.js SDK,您可以

  • 以文本或图像格式添加PDF文档的页眉和页脚。
  • 向PDF文档添加表格和文本或图像印章。
  • 将多个PDF文档附加到现有文件中。
  • 处理PDF附件、注释和表单字段。
  • 对PDF文档应用加密或解密并设置密码。
  • 从页面或整个PDF文档中删除所有印章和表格。
  • 根据ID从PDF文档中删除特定的印章或表格。
  • 替换PDF页面或整个文档中的单个或多个文本实例。
  • 广泛支持将PDF文档转换为各种其他文件格式。
  • 提取PDF文件的各种元素并优化PDF文档。
  • 您可以尝试我们的免费应用程序来测试功能。

  •