HTML JPG PDF XML DOCX
  Product Family
PDF

在 Java SDK 中将 PDF 解析为 XML 表单字段

使用服务器端 Java API 解析 PDF 文档以提取 XML 表单字段的 API

Get Started

如何使用云 Java SDK 将 PDF 文档解析为 XML 表单字段

要通过云 Java SDK 将 PDF 文档解析为 XML 表单字段,我们将使用 Aspose.PDF Cloud Java SDK 此云 Java SDK 让您能够轻松使用 Java 语言在各种云平台上构建基于云的 PDF 创建、编辑和转换应用程序。打开 Repository 在包管理器中搜索 Aspose.PDF Cloud 并安装。您也可以在包管理器控制台中使用以下命令通过 Maven 安装。

将 Aspose Cloud 仓库添加到您的应用程序 pom.xml 中

添加 Aspose Cloud 仓库


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

要将 API 客户端库安装到本地 Maven 仓库,只需执行以下操作:

从 Github 安装


    mvn clean install

若要将其部署到远程 Maven 仓库,请配置仓库设置并执行以下操作:

部署 Maven 仓库


    mvn clean deploy

使用 Java SDK 将 PDF 解析为 XML 表单字段的步骤

Aspose.PDF Cloud 开发者可以轻松将 PDF 文档解析为 XML 表单字段。开发者只需几行代码。

  1. 使用您的应用程序密钥和密钥创建一个新的 Configuration 对象
  2. 创建一个对象以连接到云 API
  3. 上传您的文档文件
  4. 使用 getExportFieldsFromPdfToXmlInStorage 函数在云存储中将 PDF 文档解析为 XML 表单字段
  5. 检查响应并记录结果
  6. 如有需要,下载本地 XNL 文件
 

此示例代码展示了如何解析 PDF 文档以提取 XML 表单字段


    import java.io.File;
    import java.nio.file.Path;
    import java.nio.file.StandardCopyOption;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdfusecases.pages.PagesHelper;

    public class ParseFormsXml {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String XML_OUTPUT_FILE = "output_sample.xml";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                //Perform action
                File f = pdfApi.getExportFieldsFromPdfToXmlInStorage(PDF_DOCUMENT, null, REMOTE_FOLDER);

                // save file
                java.nio.file.Files.copy(Path.of(f.getPath()), Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE), StandardCopyOption.REPLACE_EXISTING);
                System.out.println(String.format("File '%s' successfully dowloaded!", Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE).toString()));                
                System.out.println("Successfully parsed PDF fields as XML ! '" + XML_OUTPUT_FILE + "'");

            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

使用 .NET SDK 进行 PDF 表单解析

通过将 PDF 文档解析为 XML 表单字段,可以系统地验证每个表单字段的有效性和相关性,确保所有引用都是最新且可用的。对于下载表单字段为 XML 或进行批量分析等任务,提取表单字段实现了自动化,节省时间并减少人工工作。 使用 Aspose.PDF Cloud Java SDK 解析 PDF 文档以提取 XML 表单字段。

使用我们的 Java SDK,您可以

  • 以文本或图片格式添加 PDF 文档的页眉和页脚。
  • 向 PDF 文档添加表格、文本或图片印章。
  • 将多个 PDF 文档追加到现有文件中。
  • 处理 PDF 附件、批注和表单字段。
  • 对 PDF 文档执行加密或解密并设置密码。
  • 删除页面或整个 PDF 文档中的所有印章和表格。
  • 根据 ID 删除 PDF 文档中的特定印章或表格。
  • 替换 PDF 页面或整个文档中的单个或多个文本实例。
  • 强大的支持,将 PDF 文档转换为多种其他文件格式。
  • 提取 PDF 文件的各种元素并优化 PDF 文档。
  • 您可以试用我们的免费应用来测试功能。

  •