HTML JPG PDF XML DOCX
  Product Family
PDF

Получить таблицы из PDF в Java SDK

Получить все таблицы из PDF-документа с использованием серверного Java API.

Get Started

Как извлечь таблицы из PDF через облачный Java SDK

Для извлечения таблиц из PDF через облачный Java SDK мы будем использовать Aspose.PDF Cloud Java SDK Этот облачный SDK позволяет легко создавать облачные приложения для создания, редактирования и конвертации PDF на языке Java для различных облачных платформ. Откройте Repository в менеджере пакетов выполните поиск Aspose.PDF Cloud и установите. Вы также можете использовать следующую команду из консоли менеджера пакетов для установки через Maven.

Добавьте репозиторий Aspose Cloud в ваш pom.xml приложения

Добавить репозиторий Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Чтобы установить клиентскую библиотеку API в ваш локальный репозиторий Maven, просто выполните:

Установка из Github


    mvn clean install

Чтобы разместить его в удалённом репозитории Maven, настройте параметры репозитория и выполните:

Размещение в репозитории Maven


    mvn clean deploy

Шаги по извлечению таблиц из PDF через Java SDK

Разработчики Aspose.PDF Cloud могут легко загружать и получать таблицы из PDF всего в несколько строк кода.

  1. Создайте новый объект Configuration с вашим секретом приложения и ключом.
  2. Создайте объект для подключения к облачному API.
  3. Загрузите PDF в облачное хранилище.
  4. Извлеките таблицы из PDF в облачном хранилище, используя функцию getDocumentTables.
  5. Проверьте ответ и запишите результат в журнал.
  6. Если операция прошла успешно, выведите таблицы.
 

Этот пример кода демонстрирует извлечение таблиц из PDF-документов


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtarctAll {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Работа с таблицами в PDF

Таблицы предоставляют структурированный формат для систематического представления данных, упрощая их понимание и анализ читателями. Они также повышают визуальную привлекательность документа, придавая ему профессиональный вид и упорядоченность. При работе с числовыми или сравниваемыми данными таблицы повышают ясность, группируя связанную информацию в удобочитаемый формат. Кроме того, таблицы могут включать данные в режиме реального времени или динамически генерируемый контент, например данные из баз данных или аналитических панелей. Получите все таблицы из PDF‑документов с помощью Aspose.PDF Cloud Java SDK.

С помощью нашей Java‑библиотеки вы можете:

  • Добавлять в PDF‑документ верхний и нижний колонтитулы в формате текста или изображения.
  • Добавлять таблицы и штампы (текстовые или графические) в PDF‑документы.
  • Добавлять несколько PDF‑документов к существующему файлу.
  • Работать с вложениями PDF, аннотациями и полями форм.
  • Применять шифрование или дешифрование PDF‑документов и задавать пароль.
  • Удалять все штампы и таблицы со страницы или всего PDF‑документа.
  • Удалять конкретный штамп или таблицу из PDF‑документа по его ID.
  • Заменять отдельные или множественные вхождения текста на странице PDF или во всём документе.
  • Широкая поддержка конвертации PDF‑документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF‑файлов и оптимизировать PDF‑документы.
  • Вы можете попробовать наше бесплатное приложение, чтобы извлекать таблицы в PDF‑файлы онлайн и протестировать функциональность.

  •