HTML JPG PDF XML DOCX
  Product Family
PDF

Разбор PDF для извлечения таблицы по ID в Java SDK

API для разбора PDF‑документов с целью извлечения таблицы по ID с использованием серверного Java API.

Get Started

Как разобрать PDF‑документы для извлечения таблицы по ID с помощью Cloud Java SDK

Для разбора PDF‑документов с целью извлечения таблицы по ID через Cloud Java SDK мы будем использовать Aspose.PDF Cloud Java SDK Этот Cloud Java SDK позволяет легко создавать облачные приложения‑создатели, редакторы и конвертеры PDF на языке Java для различных облачных платформ. Откройте Repository в менеджере пакетов найдите Aspose.PDF Cloud и установите. Вы также можете использовать следующую команду в консоли диспетчера пакетов для установки через Maven.

Добавьте репозиторий Aspose Cloud в ваш файл pom.xml

Добавить репозиторий Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Чтобы установить библиотеку API‑клиента в ваш локальный репозиторий Maven, просто выполните:

Установка с Github


    mvn clean install

Чтобы разместить её в удалённом репозитории Maven, настройте параметры репозитория и выполните:

Развертывание Maven‑репозитория


    mvn clean deploy

Шаги для разбора PDF с извлечением таблицы по ID с использованием Java SDK

Разработчики Aspose.PDF Cloud могут легко разбирать PDF‑документы для извлечения таблицы по ID. Для этого требуется всего несколько строк кода.

  1. Создайте новый объект Configuration с вашим секретом приложения и ключом
  2. Создайте объект для подключения к Cloud API
  3. Загрузите файл вашего документа
  4. Разберите PDF‑документы для извлечения таблицы по ID в облачном хранилище, используя функцию getTable
  5. Проверьте ответ и запишите результат в журнал
  6. Если операция успешна, выведите извлечённую таблицу
 

Этот пример кода демонстрирует разбор PDF‑документа для извлечения таблицы по ID


    import java.io.File;
    import java.nio.file.Files;
    import java.nio.file.OpenOption;
    import java.nio.file.Path;
    import java.nio.file.StandardOpenOption;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TableRecognizedResponse;
    import com.google.gson.Gson;

    public class ParseGetTableById {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String OUTPUT_FILE     = "parsed_table_output.json";
            String TABLE_ID        = "GE5TCOZSGAYCYNRQGUWDINZVFQ3DGMA";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // perform action
                TableRecognizedResponse response = pdfApi.getTable(PDF_DOCUMENT, TABLE_ID, null,  REMOTE_FOLDER);
                System.out.println("Table extracted status: " + response.getStatus());

                TableRecognized tableDef = response.getTable();
                String jsonTable = new Gson().toJson(tableDef);

                // save json
                Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
                byte[] strToBytes = jsonTable.getBytes();
                Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
            
                System.out.println("Table successfully extracted to: '" + path + "'");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Работа с разбором таблицы по ID в PDF через Java SDK

Разбирая PDF‑документы для извлечения таблицы по ID, вы можете при необходимости изменять содержимое этой таблицы. Это сохраняет положение таблицы в документах, экономя время и снижая ручную работу. Разберите PDF‑документы для извлечения таблицы по ID с помощью Aspose.PDF Cloud Java SDK.

С помощью нашего Java SDK вы можете

  • Добавлять заголовки и колонтитулы PDF‑документов в виде текста или изображения.
  • Добавлять таблицы и текстовые или графические штампы в PDF‑документы.
  • Добавлять несколько PDF‑документов к существующему файлу.
  • Работать с вложениями PDF, аннотациями и полями форм.
  • Применяйте шифрование или дешифрование PDF‑документов и задавайте пароль.
  • Удаляйте все штампы и таблицы со страницы или всего PDF‑документа.
  • Удаляйте конкретный штамп или таблицу из PDF‑документа по его ID.
  • Заменяйте отдельные или несколько вхождений текста на странице PDF или во всём документе.
  • Широкая поддержка конвертации PDF‑документов в различные другие форматы файлов.
  • Извлекайте различные элементы PDF‑файлов и оптимизируйте PDF‑документы.
  • Вы можете попробовать наше бесплатное приложение чтобы протестировать функциональность.

  •