HTML
JPG
PDF
XML
DOCX
PDF
如何使用Cloud .NET SDK解析PDF文档以提取表单字段为XML
为了通过Cloud .NET SDK解析PDF文档以提取表单字段为XML,我们将使用 Aspose.PDF Cloud .NET SDK 这个Cloud .NET SDK允许您轻松构建基于云的PDF创建、编辑和转换应用程序,支持C#、ASP.NET或其他.NET语言,适用于各种云平台。打开 NuGet 包管理器,搜索 Aspose.PDF Cloud 并安装。您还可以使用以下命令从包管理器控制台安装。
包管理器控制台命令
PM> Install-Package Aspose.Pdf-Cloud
使用.NET SDK解析PDF以提取表单字段为XML的步骤
Aspose.PDF Cloud开发人员可以轻松解析PDF文档以提取表单字段为XML。开发人员只需几行代码即可完成。
- 使用您的应用程序密钥和密钥创建一个新的配置对象
- 创建一个对象以连接到Cloud API
- 上传您的文档文件
- 使用PutExportFieldsFromPdfToXmlInStorageAsync函数在云存储中解析PDF文档以提取表单字段为XML
- 检查响应并记录结果
- 如有需要,本地下载XNL文件
此示例代码显示解析PDF文档以提取表单字段为XML
using Aspose.Pdf.Cloud.Sdk.Model;
namespace Parser
{
public class ExportFormToXML
{
public static async Task Extract(string documentName, string outputXMLName, string remoteFolder)
{
// Get your AppSid and AppSecret from https://dashboard.aspose.cloud (free registration required).
pdfApi = new PdfApi(AppSecret, AppSid);
using (var file = File.OpenRead(Path.Combine(localFolder, documentName)))
{ // Upload the local PDF to cloud storage folder name.
FilesUploadResult uploadResponse = await pdfApi.UploadFileAsync(Path.Combine(remoteFolder, documentName), documentName);
Console.WriteLine(uploadResponse.Uploaded[0]);
}
string xmlPath = Path.Combine(remoteFolder, outputXMLName);
// Parse PDF to extract Form fields as XML in cloud storage.
AsposeResponse response = await pdfApi.PutExportFieldsFromPdfToXmlInStorageAsync(documentName, xmlPath, folder: remoteFolder);
// Checks the response and logs the result.
if (response == null)
Console.WriteLine("ExportFormToXML(): Unexpected error!");
else if (response.Code < 200 || response.Code > 299)
Console.WriteLine("ExportFormToXML(): Failed to export Pdf document form fields.");
else
{ // Downloads the updated file for local use.
Console.WriteLine("ExportFormToXML(): Pdf document '{0}' form fields successfully exported to '{1} file.", documentName, outputXMLName);
Stream stream = pdfApi.DownloadFile(Path.Combine(remoteFolder, outputXMLName));
using var fileStream = File.Create(Path.Combine(localFolder, outputXMLName));
stream.Position = 0;
await stream.CopyToAsync(fileStream);
Console.WriteLine("ExportFormToXML(): File '{0}' successfully downloaded.", outputXMLName);
}
}
}
}
通过.NET SDK处理PDF中的表单解析
通过解析PDF文档以提取表单字段为XML,可以系统地验证每个表单字段的有效性和相关性,确保所有引用都是最新和有效的。对于下载表单字段为XML或进行批量分析等任务,提取表单字段可以实现自动化,节省时间并减少手动工作。 使用Aspose.PDF Cloud .NET SDK解析PDF文档以提取表单字段为XML。
使用我们的.NET SDK,您可以
- 在PDF文档中添加文本或图像格式的页眉和页脚。
- 向PDF文档添加表格和文本或图像印章。
- 将多个PDF文档追加到现有文件。
- 处理PDF附件、注释和表单字段。
- 对PDF文档应用加密或解密并设置密码。
- 删除页面或整个PDF文档中的所有印章和表格。
- 根据ID从PDF文档中删除特定的印章或表格。
- 替换PDF页面或整个文档中的单个或多个文本实例。
- 广泛支持将PDF文档转换为各种其他文件格式。
- 提取PDF文件的各种元素并优化PDF文档。
- 您可以试用我们的免费应用来测试功能。