HTML JPG PDF XML DOCX
  Product Family
PDF

通过Node.js SDK按名称解析PDF以提取文本

使用服务器端Node.js API按名称解析PDF文档以提取文本的API。

Get Started

如何使用Cloud Node.js SDK按名称解析PDF文档以提取文本

为了通过Cloud Node.js SDK按名称解析PDF文档以提取文本,我们将使用 Aspose.PDF Cloud Node.js SDK 此Cloud SDK帮助Node.js程序员使用Aspose.PDF REST API开发基于云的PDF创建、注释、编辑、转换和解析应用程序。只需在Aspose for Cloud创建一个帐户并获取您的应用程序信息。一旦您拥有App SID和密钥,您就可以准备好使用Aspose.PDF Cloud Node.js SDK。

包管理器控制台命令


     
    npm install asposepdfcloud --save
     
     

使用Node.js SDK按名称解析PDF以提取文本的步骤

Aspose.PDF Cloud开发人员可以轻松地按名称解析PDF文档以提取文本。开发人员只需几行代码。

  1. 使用您的应用程序密钥和密钥创建一个新的配置对象
  2. 创建一个对象以连接到Cloud API
  3. 上传您的文档文件
  4. 使用getTextBoxField函数在云存储中按名称解析PDF文档以提取文本
  5. 检查响应并记录结果
  6. 如有需要,将表格信息下载为本地JSON文件
 

此示例代码显示按名称解析PDF文档以提取文本


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTextBox};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTextBox = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, textboxName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getTextBoxField(documentName, textboxName, null, remoteFolder);
            if (response.body.code == 200) {
                console.log("ParseExportTextBox(): TextBox Filed successfully extracted!");
         	const result = JSON.stringify(response.boby.field);
                const filePath = path.join(localFolder, "parsed_text_box_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTextBox(): Unexpected error!") 

        }
    }
};
 

通过Node.js SDK处理PDF中的文本解析

通过按名称解析PDF文档以提取文本,您可以根据需要修改TextBox字段的内容。这保持了文档中文本的位置,同时节省了时间并减少了手动工作。 使用Aspose.PDF Cloud Node.js SDK按名称解析PDF文档以提取文本。

使用我们的Node.js SDK,您可以

  • 以文本或图像格式添加PDF文档的页眉和页脚。
  • 向PDF文档添加表格和文本或图像印章。
  • 将多个PDF文档附加到现有文件中。
  • 处理PDF附件、注释和表单字段。
  • 对PDF文档应用加密或解密并设置密码。
  • 从页面或整个PDF文档中删除所有印章和表格。
  • 根据ID从PDF文档中删除特定的印章或表格。
  • 替换PDF页面或整个文档中的单个或多个文本实例。
  • 广泛支持将PDF文档转换为各种其他文件格式。
  • 提取PDF文件的各种元素并优化PDF文档。
  • 您可以尝试我们的免费应用程序来测试功能。

  •