HTML JPG PDF XML DOCX
  Product Family
PDF

Разбор PDF для извлечения текста по имени в Node.js SDK

API для разбора PDF-документов для извлечения текста по имени с использованием серверного API Node.js.

Get Started

Как разобрать PDF-документы для извлечения текста по имени с использованием Cloud Node.js SDK

Для разбора PDF-документов для извлечения текста по имени через Cloud Node.js SDK мы будем использовать Aspose.PDF Cloud Node.js SDK Этот Cloud SDK помогает программистам на Node.js разрабатывать облачные приложения для создания, аннотирования, редактирования, конвертации и разбора PDF с использованием языка программирования Node.js через Aspose.PDF REST API. Просто создайте учетную запись на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас есть SID и ключ приложения, вы готовы использовать Aspose.PDF Cloud Node.js SDK.

Команда консоли диспетчера пакетов


     
    npm install asposepdfcloud --save
     
     

Шаги для разбора PDF для извлечения текста по имени с использованием Node.js SDK

Разработчики Aspose.PDF Cloud могут легко разбирать PDF-документы для извлечения текста по имени. Разработчикам потребуется всего несколько строк кода.

  1. Создайте новый объект Configuration с вашим секретом приложения и ключом
  2. Создайте объект для подключения к Cloud API
  3. Загрузите ваш файл документа
  4. Разберите PDF-документы для извлечения текста по имени в облачном хранилище, используя функцию getTextBoxField
  5. Проверьте ответ и зарегистрируйте результат
  6. Скачайте информацию о таблицах в JSON-файл локально, если необходимо
 

Этот пример кода показывает разбор PDF-документа для извлечения текста по имени


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTextBox};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTextBox = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, textboxName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getTextBoxField(documentName, textboxName, null, remoteFolder);
            if (response.body.code == 200) {
                console.log("ParseExportTextBox(): TextBox Filed successfully extracted!");
         	const result = JSON.stringify(response.boby.field);
                const filePath = path.join(localFolder, "parsed_text_box_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTextBox(): Unexpected error!") 

        }
    }
};
 

Работа с разбором текста в PDF через Node.js SDK

Разбирая PDF-документы для извлечения текста по имени, вы можете изменять содержимое текстового поля по мере необходимости. Это сохраняет позицию текста в документах, сокращая время и уменьшая ручную работу. Разберите PDF-документы для извлечения текста по имени с Aspose.PDF Cloud Node.js SDK.

С нашим Node.js SDK вы можете

  • Добавлять заголовок и нижний колонтитул PDF-документа в текстовом или графическом формате.
  • Добавлять таблицы и текстовые или графические штампы в PDF-документы.
  • Присоединять несколько PDF-документов к существующему файлу.
  • Работать с вложениями, аннотациями и полями форм в PDF.
  • Применять шифрование или дешифрование к PDF-документам и устанавливать пароль.
  • Удалять все штампы и таблицы со страницы или всего PDF-документа.
  • Удалять конкретный штамп или таблицу из PDF-документа по его ID.
  • Заменять одиночные или множественные экземпляры текста на странице PDF или из всего документа.
  • Обширная поддержка конвертации PDF-документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF-файлов и оптимизировать PDF-документы.
  • Вы можете попробовать наше бесплатное приложение для тестирования функциональности.

  •