Извлечение текста из PDF в Node.js SDK
Извлечение текста из PDF-документа с использованием Cloud Node.js SDK.
Get StartedКак извлечь текст из PDF через Node.js SDK
Чтобы извлечь текст из PDF, мы будем использовать Aspose.PDF Cloud Node.js SDK. Этот Cloud SDK помогает программистам Node.js разрабатывать облачные приложения для создания, аннотирования, редактирования и конвертации PDF с использованием языка программирования Node.js через Aspose.PDF REST API. Просто создайте учетную запись на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас будет App SID и ключ, вы готовы использовать Aspose.PDF Cloud Node.js SDK.
Команда консоли диспетчера пакетов
npm install asposepdfcloud --save
Шаги для извлечения текста с использованием Node.js
Разработчики Aspose.PDF Cloud могут легко загружать и извлекать текст из PDF всего в нескольких строках кода.
- Загрузите секретный ключ и ключ приложения из JSON-файла или установите учетные данные другим способом
- Создайте объект для подключения к Cloud API
- Загрузите файл документа
- Выполните извлечение текста с помощью функции pdfApi.getText
- Скачайте результат, если это необходимо
Извлечение текста из PDF с использованием Node.js
async function () {
const pdfApi = new PdfApi(credentials.id, credentials.key);
try {
const fileBuffer = await fs.readFile(LOCAL_FILE_NAME);
await pdfApi.uploadFile(STORAGE_FILENAME, fileBuffer);
const result = await pdfApi.getText(STORAGE_FILENAME, 0, 0, 0, 0);
const lines = result.body.textOccurrences.list.map(line=>line.text).join("\n");
await fs.writeFile("extracted.txt", lines);
}
catch (error) {
console.error(error.message);
}
}
Работа с текстом в PDF
Извлечение текста позволяет анализировать, организовывать или обрабатывать данные из PDF в внешних приложениях. Извлеченный текст может индексироваться, что делает его доступным для поиска в базах данных или системах управления контентом. Это улучшает поиск документов и обеспечивает более быстрый доступ к определенной информации, особенно в больших архивах документов. Извлекая текст и сохраняя его в более простом формате (например, в виде простого текста или XML), пользователи могут уменьшить размер файлов, что облегчает их передачу или распространение. Извлекайте текст из PDF-документов с помощью Aspose.PDF Cloud Node.js SDK.
С нашей библиотекой Node.js вы можете:
- Добавлять заголовок и нижний колонтитул PDF-документа в текстовом или графическом формате.
- Добавлять таблицы и штампы (текстовые или графические) в PDF-документы.
- Присоединять несколько PDF-документов к существующему файлу.
- Работать с вложениями PDF, аннотациями и полями формы.
- Применять шифрование или дешифрование к PDF-документам и устанавливать пароль.
- Удалять все штампы и таблицы со страницы или всего PDF-документа.
- Удалять определенный штамп или таблицу из PDF-документа по его ID.
- Заменять одно или несколько вхождений текста на странице PDF или во всем документе.
- Широкая поддержка конвертации PDF-документов в различные другие форматы файлов.
- Извлекать различные элементы файлов PDF и оптимизировать PDF-документы.
- Вы можете попробовать наше бесплатное приложение для извлечения текста из PDF-файлов онлайн и протестировать функциональность.
- Ресурсы для обучения
- Документация
- Исходный код
- Ссылки на API
- Поддержка продукта
- Бесплатная поддержка
- Платная поддержка
- Блог
- Почему Aspose.PDF Cloud для Node.js?
- Список клиентов
- Безопасность