Разбор PDF для извлечения таблиц в Java SDK

API для разбора PDF‑документов с целью извлечения таблиц с использованием серверного Java API.

Get Started

NET PHP PYTHON GO NODEJS

Как разобрать PDF‑документы для извлечения таблиц с использованием облачного Java SDK

Для разбора PDF‑документов с целью извлечения таблиц через облачный Java SDK мы будем использовать Aspose.PDF Cloud Java SDK Этот облачный Java SDK позволяет легко создавать облачные приложения‑создатели, редакторы и конвертеры PDF на языке Java для различных облачных платформ. Открыть Repository в менеджере пакетов найдите Aspose.PDF Cloud и установите. Вы также можете использовать следующую команду в консоли менеджера пакетов для установки через Maven.

Добавьте репозиторий Aspose Cloud в ваш файл pom.xml приложения

Добавить репозиторий Aspose Cloud
    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Чтобы установить библиотеку клиента API в ваш локальный репозиторий Maven, просто выполните:

Установка с Github
    mvn clean install

Чтобы разместить её в удалённом репозитории Maven, настройте параметры репозитория и выполните:

Развертывание Maven репозитория
    mvn clean deploy

Шаги по разбору PDF для извлечения таблиц с использованием Java SDK

Разработчики Aspose.PDF Cloud могут легко разбирать PDF‑документы для извлечения таблиц. Для этого требуется всего несколько строк кода.

Создайте новый объект Configuration с вашим секретом приложения и ключом
Создайте объект для подключения к облачному API
Загрузите файл вашего документа
Разберите PDF‑документы для извлечения таблиц в облачном хранилище с помощью функции getDocumentTables
Проверьте ответ и запишите результат в журнал
Если операция прошла успешно, выведите извлечённые таблицы

Этот пример кода демонстрирует разбор PDF‑документа для извлечения таблиц
    import java.io.File;
    import java.nio.file.Files;
    import java.nio.file.OpenOption;
    import java.nio.file.StandardOpenOption;
    import java.nio.file.Path;
    import com.google.gson.Gson;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class ParseGetTables {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String OUTPUT_FILE     = "parsed_tables_output.json";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // perform action
                TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null,  REMOTE_FOLDER);
                System.out.println("Tables extracted status: " + response.getStatus());

                String jsonResult = "[\n";
                for (TableRecognized tableDef : response.getTables().getList()) {
                    String jsonTable = new Gson().toJson(tableDef);
                    jsonResult += jsonTable + ",\n\n";
                }
                jsonResult +="]";

                // save json
                Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
                byte[] strToBytes = jsonResult.getBytes();
                Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
            
                System.out.println("Tables successfully extracted to: '" + path + "'");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }

Работа с разбором таблиц в PDF через Java SDK

Разбирая PDF‑документы для извлечения таблиц, вы можете при необходимости изменять их содержимое. Это сохраняет положение таблицы в документах, экономя время и сокращая ручную работу. Разбирайте PDF‑документы для извлечения таблиц с помощью Aspose.PDF Cloud Java SDK.

С нашим Java SDK вы можете

Добавлять заголовок и нижний колонтитул PDF‑документов в формате текста или изображения.
Добавлять таблицы и текстовые или графические штампы в PDF‑документы.
Добавлять несколько PDF‑документов к существующему файлу.
Работать с вложениями PDF, аннотациями и полями форм.
Применять шифрование или дешифрование PDF‑документов и задавать пароль.
Удалять все штампы и таблицы со страницы или всего PDF‑документа.
Удалять определённый штамп или таблицу из PDF‑документа по её идентификатору.
Заменять один или несколько вхождений текста на странице PDF или во всём документе.
Широкая поддержка конвертации PDF‑документов в различные форматы файлов.
Извлекать различные элементы PDF‑файлов и оптимизировать PDF‑документы.
Вы можете попробовать наше бесплатное приложение для тестирования функциональности.

Why Aspose.PDF Cloud for Java?
Customers List
Security

Разбор PDF для извлечения таблиц в Java SDK

API для разбора PDF‑документов с целью извлечения таблиц с использованием серверного Java API.

Aspose.PDF Cloud SDK для Java

Overview

Как разобрать PDF‑документы для извлечения таблиц с использованием облачного Java SDK

Добавить репозиторий Aspose Cloud

Установка с Github

Развертывание Maven репозитория

Шаги по разбору PDF для извлечения таблиц с использованием Java SDK

Этот пример кода демонстрирует разбор PDF‑документа для извлечения таблиц

Работа с разбором таблиц в PDF через Java SDK