Извлечение таблиц из PDF в Node.js SDK
API для работы с таблицами в PDF документах с использованием облачного SDK Node.js
Get StartedКак получить таблицы из PDF через Node.js SDK
Чтобы извлечь таблицы из PDF, мы будем использовать Aspose.PDF Cloud Node.js SDK. Этот облачный SDK помогает программистам на Node.js разрабатывать облачные приложения для создания, аннотирования, редактирования и конвертации PDF, используя язык программирования Node.js через REST API Aspose.PDF. Просто создайте аккаунт на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас будут SID и ключ приложения, вы готовы использовать Aspose.PDF Cloud Node.js SDK.
Команда консоли диспетчера пакетов
npm install asposepdfcloud --save
Шаги для получения таблиц из PDF через облачный Node.js
Разработчики Aspose.PDF Cloud могут легко загружать и извлекать таблицы из PDF всего за несколько строк кода.
- Прочитайте локальный PDF файл.
- Загрузите локальный PDF в Aspose Cloud.
- Извлеките и отобразите все обнаруженные таблицы.
- Извлеките и отобразите одну таблицу по её ID.
- Загрузите обновленный PDF файл из хранилища Aspose PDF Cloud.
Получение таблиц из PDF с использованием Node.js
import credentials from "../../../../Credentials/credentials.json" with { type: "json" };
import fs from 'node:fs/promises';
import path from 'node:path';
import { PdfApi } from "../../../src/api/api.js";
const configParams = {
LOCAL_FOLDER: "C:\\Samples\\",
PDF_DOCUMENT_NAME: "sample.pdf",
PAGE_NUMBER: 2, // Your document page number...
TABLE_ID: "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA", // Your table id...
};
const pdfApi = new PdfApi(credentials.id, credentials.key);
const pdfTables = {
async uploadDocument () {
const fileNamePath = path.join(configParams.LOCAL_FOLDER, configParams.PDF_DOCUMENT_NAME);
const pdfFileData = await fs.readFile(fileNamePath);
await pdfApi.uploadFile(configParams.PDF_DOCUMENT_NAME, pdfFileData);
},
async getAllTables () {
const resultTabs = await pdfApi.getDocumentTables(configParams.PDF_DOCUMENT_NAME);
if (resultTabs.body.code == 200 && resultTabs.body.tables) {
if (!Array.isArray(resultTabs.body.tables.list) || resultTabs.body.tables.list.length === 0) {
throw new Error("Unexpected error : tables is null or empty!!!");
}
this.showTablesInfo(resultTabs.body.tables.list, "All tables");
return resultTabs.body.tables.list;
}
else
console.error("Unexpected error : can't get links!!!");
},
async getTableById () {
const resultTabs = await pdfApi.getTable(configParams.PDF_DOCUMENT_NAME, configParams.TABLE_ID);
if (resultTabs.body.code == 200 && resultTabs.body.table) {
this.showTablesInfo( [ resultTabs.body.table ], "Table by Id");
return resultTabs.body.table;
}
else
console.error("Unexpected error : can't get links!!!");
},
showTablesInfo(tables, prefix) {
if (Array.isArray(tables) && tables.length > 0)
{
tables.forEach(function(table) {
console.log(prefix +" => id: '" + table.id + "', page: '" + table.pageNum + "', rows: '" + table.rowList.length + "', columns: '" + table.rowList[0].cellList.length + "'");
});
}
else
console.error("showBoormarks() error: array of tables is empty!")
},
}
async function main() {
try {
await pdfTables.uploadDocument();
await pdfTables.getAllTables();
await pdfTables.getTableById();
} catch (error) {
console.error("Error:", error.message);
}
}
Получение таблиц из PDF
Извлечение таблиц из PDF документов является важным для преобразования статического, неструктурированного контента в используемые, структурированные данные. Это позволяет эффективно анализировать данные, автоматизировать процессы, интегрироваться с бизнес-системами и осуществлять цифровую трансформацию. Этот процесс экономит время, улучшает точность, поддерживает обработку документов в крупном масштабе и позволяет легко повторно использовать данные в отчетах, приложениях и аудитах. Извлекайте таблицы из PDF документов с помощью Aspose.PDF Cloud Node.js SDK.
С нашей библиотекой для Node.js вы можете:
- Добавлять заголовок и нижний колонтитул PDF документа в текстовом или графическом формате.
- Добавлять таблицы и штампы (текст или изображение) в PDF документы.
- Присоединять несколько PDF документов к существующему файлу.
- Работать с вложениями PDF, аннотациями и полями форм.
- Применять шифрование или дешифрование к PDF документам и устанавливать пароль.
- Удалять все штампы и таблицы со страницы или из всего PDF документа.
- Удалять конкретный штамп или таблицу из PDF документа по их ID.
- Заменять одно или несколько вхождений текста на странице PDF или во всем документе.
- Широкая поддержка конвертации PDF документов в различные другие форматы файлов.
- Извлекать различные элементы PDF файлов и оптимизировать PDF документы.
- Вы можете попробовать наше бесплатное приложение для извлечения таблиц в PDF файлы онлайн и тестирования функциональности.
- Учебные ресурсы
- Документация
- Исходный код
- Справочники API
- Поддержка продукта
- Бесплатная поддержка
- Платная поддержка
- Блог
- Почему Aspose.PDF Cloud для Node.js?
- Список клиентов
- Безопасность