HTML JPG PDF XML DOCX
  Product Family
PDF

Анализировать PDF для извлечения текстов в Node.js SDK

API для анализа PDF-документов для извлечения текстов с использованием серверного API Node.js.

Get Started

Как анализировать PDF-документы для извлечения текстов с использованием Cloud Node.js SDK

Для анализа PDF-документов для извлечения текстов через Cloud Node.js SDK мы будем использовать Aspose.PDF Cloud Node.js SDK Этот Cloud SDK помогает программистам Node.js разрабатывать облачные приложения для создания, аннотирования, редактирования, преобразования и анализа PDF с использованием языка программирования Node.js через Aspose.PDF REST API. Просто создайте учетную запись на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас будут SID и ключ приложения, вы готовы использовать Aspose.PDF Cloud Node.js SDK.

Команда консоли диспетчера пакетов


     
    npm install asposepdfcloud --save
     
     

Шаги для анализа PDF для извлечения текстов с использованием Node.js SDK

Разработчики Aspose.PDF Cloud могут легко анализировать PDF-документы для извлечения текстов. Разработчикам нужно всего несколько строк кода.

  1. Создайте новый объект Configuration с вашим секретом приложения и ключом
  2. Создайте объект для подключения к Cloud API
  3. Загрузите ваш файл документа
  4. Анализируйте PDF-документы для извлечения текстов в облачном хранилище с использованием функции getDocumentTextBoxFields
  5. Проверьте ответ и зарегистрируйте результат
  6. Скачайте информацию о текстовых блоках в файле JSON локально, если необходимо
 

Этот пример кода показывает анализ PDF-документа для извлечения текстов


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTextBoxes};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTextBoxes = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getDocumentTextBoxFields( documentName, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportTextBoxes(): TextBox Fileds successfully extracted!");
                
                var result = "[\n";
                await Promise.all(
                    response.body.fields.list.map(async (textbox) => {
                        const responseText = await pdfApi.getTextBoxField(documentName, textbox.fullName, null, remoteFolder)
                            .then(function(responseTextBox){
                                result += JSON.stringify(textbox) + ",\n\n";
                            });
                        })
                    );
                result += "]";

                const filePath = path.join(localFolder, "parsed_text_boxes_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTextBoxes(): Unexpected error!") 

        }
    }
};
 

Работа с анализом текста в PDF через Node.js SDK

Анализируя PDF-документы для извлечения текстов, вы можете изменить содержимое полей TextBox по мере необходимости. Это сохраняет положение текста в документах, экономя время и снижая объем ручной работы. Анализируйте PDF-документы для извлечения текстов с Aspose.PDF Cloud Node.js SDK.

С нашим Node.js SDK вы можете

  • Добавлять заголовок и нижний колонтитул документа PDF в текстовом или графическом формате.
  • Добавлять таблицы и текстовые или графические штампы в PDF-документы.
  • Присоединять несколько PDF-документов к существующему файлу.
  • Работать с вложениями, аннотациями и полями форм PDF.
  • Применять шифрование или дешифрование к PDF-документам и устанавливать пароль.
  • Удалять все штампы и таблицы со страницы или всего PDF-документа.
  • Удалять определенный штамп или таблицу из PDF-документа по его ID.
  • Заменять одиночные или множественные вхождения текста на странице PDF или во всем документе.
  • Широкая поддержка для преобразования PDF-документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF-файлов и оптимизировать PDF-документы.
  • Вы можете попробовать наше бесплатное приложение, чтобы протестировать функциональность.

  •