HTML
JPG
PDF
XML
DOCX
PDF
如何使用云 Java SDK 将 PDF 文档解析为 XML 表单字段
要通过云 Java SDK 将 PDF 文档解析为 XML 表单字段,我们将使用 Aspose.PDF Cloud Java SDK 此云 Java SDK 让您能够轻松使用 Java 语言在各种云平台上构建基于云的 PDF 创建、编辑和转换应用程序。打开 Repository 在包管理器中搜索 Aspose.PDF Cloud 并安装。您也可以在包管理器控制台中使用以下命令通过 Maven 安装。
将 Aspose Cloud 仓库添加到您的应用程序 pom.xml 中
添加 Aspose Cloud 仓库
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
要将 API 客户端库安装到本地 Maven 仓库,只需执行以下操作:
从 Github 安装
mvn clean install
若要将其部署到远程 Maven 仓库,请配置仓库设置并执行以下操作:
部署 Maven 仓库
mvn clean deploy
使用 Java SDK 将 PDF 解析为 XML 表单字段的步骤
Aspose.PDF Cloud 开发者可以轻松将 PDF 文档解析为 XML 表单字段。开发者只需几行代码。
- 使用您的应用程序密钥和密钥创建一个新的 Configuration 对象
- 创建一个对象以连接到云 API
- 上传您的文档文件
- 使用 getExportFieldsFromPdfToXmlInStorage 函数在云存储中将 PDF 文档解析为 XML 表单字段
- 检查响应并记录结果
- 如有需要,下载本地 XNL 文件
此示例代码展示了如何解析 PDF 文档以提取 XML 表单字段
import java.io.File;
import java.nio.file.Path;
import java.nio.file.StandardCopyOption;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdfusecases.pages.PagesHelper;
public class ParseFormsXml {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String XML_OUTPUT_FILE = "output_sample.xml";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
//Perform action
File f = pdfApi.getExportFieldsFromPdfToXmlInStorage(PDF_DOCUMENT, null, REMOTE_FOLDER);
// save file
java.nio.file.Files.copy(Path.of(f.getPath()), Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE), StandardCopyOption.REPLACE_EXISTING);
System.out.println(String.format("File '%s' successfully dowloaded!", Path.of(LOCAL_FOLDER, XML_OUTPUT_FILE).toString()));
System.out.println("Successfully parsed PDF fields as XML ! '" + XML_OUTPUT_FILE + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
使用 .NET SDK 进行 PDF 表单解析
通过将 PDF 文档解析为 XML 表单字段,可以系统地验证每个表单字段的有效性和相关性,确保所有引用都是最新且可用的。对于下载表单字段为 XML 或进行批量分析等任务,提取表单字段实现了自动化,节省时间并减少人工工作。 使用 Aspose.PDF Cloud Java SDK 解析 PDF 文档以提取 XML 表单字段。
使用我们的 Java SDK,您可以
- 以文本或图片格式添加 PDF 文档的页眉和页脚。
- 向 PDF 文档添加表格、文本或图片印章。
- 将多个 PDF 文档追加到现有文件中。
- 处理 PDF 附件、批注和表单字段。
- 对 PDF 文档执行加密或解密并设置密码。
- 删除页面或整个 PDF 文档中的所有印章和表格。
- 根据 ID 删除 PDF 文档中的特定印章或表格。
- 替换 PDF 页面或整个文档中的单个或多个文本实例。
- 强大的支持,将 PDF 文档转换为多种其他文件格式。
- 提取 PDF 文件的各种元素并优化 PDF 文档。
- 您可以试用我们的免费应用来测试功能。
- Learning Resources
- Documentation
- Source Code
- API References
- Product Support
- Free Support
- Paid Support
- Blog
- Why Aspose.PDF Cloud for Java?
- Customers List
- Security