HTML JPG PDF XML DOCX
  Product Family
PDF

Анализ PDF для извлечения таблиц в Node.js SDK

API для анализа PDF-документов для извлечения таблиц с использованием серверного API Node.js.

Get Started

Как анализировать PDF-документы для извлечения таблиц с помощью Cloud Node.js SDK

Для анализа PDF-документов для извлечения таблиц через Cloud Node.js SDK мы будем использовать Aspose.PDF Cloud Node.js SDK Этот Cloud SDK помогает программистам Node.js разрабатывать облачные приложения для создания, аннотирования, редактирования, конвертации и анализа PDF-документов, используя язык программирования Node.js через Aspose.PDF REST API. Просто создайте учетную запись на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас будет App SID и ключ, вы готовы использовать Aspose.PDF Cloud Node.js SDK.

Команда консоли диспетчера пакетов


     
    npm install asposepdfcloud --save
     
     

Шаги для анализа PDF для извлечения таблиц с использованием Node.js SDK

Разработчики Aspose.PDF Cloud могут легко анализировать PDF-документы для извлечения таблиц. Разработчикам нужно всего несколько строк кода.

  1. Создайте новый объект Configuration с вашим секретом приложения и ключом
  2. Создайте объект для подключения к Cloud API
  3. Загрузите файл вашего документа
  4. Анализируйте PDF-документы для извлечения таблиц в облачном хранилище, используя функцию getDocumentTables
  5. Проверьте ответ и запишите результат
  6. Загрузите информацию о таблицах в JSON файл локально, если необходимо
 

Этот пример кода показывает анализ PDF-документа для извлечения таблиц


import fs from 'node:fs/promises';
import path from 'node:path';

export {ParseExportTables};

const pdfApi = new PdfApi(APP_SID, APP_KEY);

const ParseExportTables = {
    async uploadDocument (documentName, localFolder, tempFolder) {
        const fileNamePath = path.join(localFolder, documentName);
        const fileData = await fs.readFile(fileNamePath);
        const storagePath = path.join(tempFolder, documentName);
        await pdfApi.uploadFile(storagePath, fileData)
            .then(() => console.log("File: '" + documentName +"' successfully uploaded."));
    },
    
    async export(documentName, localFolder, remoteFolder) {
        if ( pdfApi ) {
            await uploadDocument(documentName, localFolder, remoteFolder);

            const response = await pdfApi.getDocumentTables( documentName, null, remoteFolder );

            if (response.body.code == 200) {
                console.log("ParseExportTables(): Tables successfully extracted!");

                var result = "[\n";
                await Promise.all(
                    response.body.tables.list.map(async (table) => {
                        const responseTable = await pdfApi.getTable(documentName, table.id, null, remoteFolder)
                            .then(function(responseTable){
                                result += JSON.stringify(table) + ",\n\n";
                            });
                        })
                    );
                result += "]";

                const filePath = path.join(localFolder, "parsed_tables_output.json");
                await fs.writeFile(filePath, result);
                console.log("Downloaded: " + filePath);   
            }
            else
                console.error("ParseExportTables(): Unexpected error!") 

        }
    }
};
 

Работайте с анализом таблиц в PDF через Node.js SDK

Анализируя PDF-документы для извлечения таблиц, вы можете изменять содержимое таблиц по мере необходимости. Это сохраняет положение таблицы в документах, экономя время и уменьшая ручную работу. Анализируйте PDF-документы для извлечения таблиц с помощью Aspose.PDF Cloud Node.js SDK.

С нашим Node.js SDK вы можете

  • Добавлять заголовок и нижний колонтитул PDF-документа в текстовом или графическом формате.
  • Добавлять таблицы и текстовые или графические штампы в PDF-документы.
  • Объединять несколько PDF-документов в существующий файл.
  • Работать с вложениями PDF, аннотациями и полями форм.
  • Применять шифрование или дешифрование к PDF-документам и устанавливать пароль.
  • Удалять все штампы и таблицы со страницы или всего PDF-документа.
  • Удалять конкретный штамп или таблицу из PDF-документа по их идентификатору.
  • Заменять одно или несколько вхождений текста на странице PDF или во всем документе.
  • Обширная поддержка конвертации PDF-документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF-файлов и оптимизировать PDF-документы.
  • Вы можете попробовать наше бесплатное приложение, чтобы протестировать функциональность.

  •