HTML JPG PDF XML DOCX
  Product Family
PDF

Разобрать PDF для извлечения полей формы в формате XML в Java SDK

API для разбора PDF‑документов с целью извлечения полей формы в формате XML с использованием серверного Java API.

Get Started

Как разобрать PDF‑документы для извлечения полей формы в формате XML с использованием облачного Java SDK

Для разбора PDF‑документов с целью извлечения полей формы в формате XML через облачный Java SDK мы будем использовать Aspose.PDF Cloud Java SDK Этот облачный Java SDK позволяет легко создавать облачные приложения‑создатели, редакторы и конвертеры PDF на языке Java для различных облачных платформ. Откройте Repository в менеджере пакетов найдите Aspose.PDF Cloud и установите. Вы также можете использовать следующую команду в консоли менеджера пакетов для установки через Maven.

Добавьте репозиторий Aspose Cloud в файл pom.xml вашего приложения

Добавить репозиторий Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

Чтобы установить библиотеку API‑клиента в ваш локальный репозиторий Maven, просто выполните:

Установка из Github


    mvn clean install

Чтобы развернуть её в удалённом репозитории Maven, настройте параметры репозитория и выполните:

Развернуть Maven‑репозиторий


    mvn clean deploy

Шаги для разбора PDF с извлечением полей формы в формате XML с помощью Java SDK

Разработчики Aspose.PDF Cloud могут с лёгкостью разбирать PDF‑документы для извлечения полей формы в формате XML. Для этого требуется всего несколько строк кода.

  1. Создайте новый объект Configuration, указав ваш секрет приложения и ключ
  2. Создайте объект для подключения к облачному API
  3. Загрузите файл вашего документа
  4. Разберите PDF‑документы для извлечения полей формы в формате XML в облачном хранилище, используя функцию getExportFieldsFromPdfToXmlInStorage
  5. Проверьте ответ и запишите результат в журнал
  6. При необходимости скачайте файл XNL локально
 

Этот пример кода демонстрирует разбор PDF‑документа для извлечения полей формы в формате XML


    import java.io.File;
    import java.nio.file.Path;
    import java.nio.file.StandardCopyOption;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdfusecases.pages.PagesHelper;

    public class ParseFormsXml {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String XML_OUTPUT_FILE = "output_sample.xml";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                //Perform action
                File f = pdfApi.getExportFieldsFromPdfToXmlInStorage(PDF_DOCUMENT, null, REMOTE_FOLDER);

                // save file
                java.nio.file.Files.copy(Path.of(f.getPath()), Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE), StandardCopyOption.REPLACE_EXISTING);
                System.out.println(String.format("File '%s' successfully dowloaded!", Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE).toString()));                
                System.out.println("Successfully parsed PDF fields as XML ! '" + XML_OUTPUT_FILE + "'");

            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

Работа с разбором форм в PDF через .NET SDK

Разбирая PDF‑документы для извлечения полей формы в формате XML, можно систематически проверять корректность и актуальность каждого поля формы, гарантируя, что все ссылки являются текущими и рабочими. Для задач, таких как загрузка полей формы в формате XML или проведение пакетного анализа, извлечение полей формы обеспечивает автоматизацию, экономя время и снижая ручные усилия. Разберите PDF‑документы для извлечения полей формы в формате XML с помощью Aspose.PDF Cloud Java SDK.

С помощью нашего Java SDK вы можете

  • Добавить заголовок и нижний колонтитул PDF‑документа в текстовом или графическом виде.
  • Добавлять таблицы и текстовые или графические штампы в PDF‑документы.
  • Добавлять несколько PDF‑документов к существующему файлу.
  • Работать с вложениями PDF, аннотациями и полями формы.
  • Применять шифрование или дешифрование PDF‑документов и задавать пароль.
  • Удалять все штампы и таблицы со страницы или всего PDF‑документа.
  • Удалять определённый штамп или таблицу из PDF‑документа по её ID.
  • Заменять отдельные или множественные вхождения текста на странице PDF или во всём документе.
  • Широкая поддержка преобразования PDF‑документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF‑файлов и оптимизировать PDF‑документы.
  • Вы можете попробовать наше бесплатное приложение для проверки функциональности.

  •