HTML JPG PDF XML DOCX
  Product Family
PDF

Получить таблицы на странице из PDF в Java SDK

Получить все таблицы на странице из PDF-документа с помощью серверного Java API.

Get Started

Как извлечь таблицы на странице из PDF через Cloud Java SDK

Для извлечения таблиц на странице из PDF через Cloud Java SDK мы будем использовать Aspose.PDF Cloud Java SDK Этот облачный SDK позволяет легко создавать облачные приложения‑создатели, редакторы и конвертеры PDF на C#, ASPJava или других языках Java для различных облачных платформ. Откройте Repository в менеджере пакетов найдите Aspose.PDF Cloud и установите. Вы также можете использовать следующую команду из консоли диспетчера пакетов для установки через Maven.

Добавьте репозиторий Aspose Cloud в ваш файл pom.xml

Добавить репозиторий Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Чтобы установить библиотеку клиента API в ваш локальный Maven‑репозиторий, просто выполните:

Установка из Github


    mvn clean install

Чтобы развернуть его в удалённом Maven‑репозитории, настройте параметры репозитория и выполните:

Развернуть Maven репозиторий


    mvn clean deploy

Шаги по извлечению таблиц на странице из PDF через Java SDK

Разработчики Aspose.PDF Cloud могут легко загрузить и получить таблицы на странице из PDF всего за несколько строк кода.

  1. Создайте новый объект Configuration, указав ваш секрет приложения и ключ.
  2. Создайте объект для подключения к облачному API.
  3. Загрузите PDF в облачное хранилище.
  4. Извлеките таблицы на странице из PDF в облачном хранилище, используя функцию getPageTables.
  5. Проверьте ответ и запишите результат в журнал.
  6. Если операция прошла успешно, выведите таблицы
 

Этот пример кода демонстрирует извлечение таблиц на странице из PDF-документов


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtractOnPage {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
            Integer PAGE_NUMBER    = 1;

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getPageTables(PDF_DOCUMENT, PAGE_NUMBER, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Работа с таблицами в PDF

Таблицы предоставляют структурированный формат для систематического представления данных, облегчая читателям понимание и анализ информации. Они также повышают визуальную привлекательность документа, добавляя профессионализм и организованность. При работе с числовыми или сравнительными данными таблицы улучшают ясность, группируя связанную информацию в удобочитаемый формат. Кроме того, таблицы могут включать контент в реальном времени или динамически генерируемый, такой как данные из баз данных или аналитических панелей. Получите все таблицы на странице из PDF‑документов с помощью Aspose.PDF Cloud Java SDK.

С нашей Java‑библиотекой вы можете:

  • Добавлять заголовки и нижние колонтитулы PDF‑документов в текстовом или графическом формате.
  • Добавлять таблицы и штампы (текстовые или графические) в PDF‑документы.
  • Добавлять несколько PDF‑документов к существующему файлу.
  • Работать с вложениями PDF, аннотациями и полями форм.
  • Применять шифрование или дешифрование PDF‑документов и устанавливать пароль.
  • Удалять все штампы и таблицы со страницы или всего PDF‑документа.
  • Удалять конкретный штамп или таблицу из PDF‑документа по их идентификатору.
  • Заменять отдельные или несколько вхождений текста на странице PDF или во всем документе.
  • Широкая поддержка конвертации PDF‑документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF‑файлов и оптимизировать PDF‑документы.
  • Вы можете опробовать наше бесплатное приложение для извлечения таблиц из PDF‑файлов онлайн и протестировать функциональность.

  •