HTML JPG PDF XML DOCX
  Product Family
PDF

解析PDF以提取表单字段为XML在.NET SDK中

使用服务器端.NET API解析PDF文档以提取表单字段为XML的API。

Get Started

如何使用Cloud .NET SDK解析PDF文档以提取表单字段为XML

为了通过Cloud .NET SDK解析PDF文档以提取表单字段为XML,我们将使用 Aspose.PDF Cloud .NET SDK 这个Cloud .NET SDK允许您轻松构建基于云的PDF创建、编辑和转换应用程序,支持C#、ASP.NET或其他.NET语言,适用于各种云平台。打开 NuGet 包管理器,搜索 Aspose.PDF Cloud 并安装。您还可以使用以下命令从包管理器控制台安装。

包管理器控制台命令


     
    PM> Install-Package Aspose.Pdf-Cloud
     
     

使用.NET SDK解析PDF以提取表单字段为XML的步骤

Aspose.PDF Cloud开发人员可以轻松解析PDF文档以提取表单字段为XML。开发人员只需几行代码即可完成。

  1. 使用您的应用程序密钥和密钥创建一个新的配置对象
  2. 创建一个对象以连接到Cloud API
  3. 上传您的文档文件
  4. 使用PutExportFieldsFromPdfToXmlInStorageAsync函数在云存储中解析PDF文档以提取表单字段为XML
  5. 检查响应并记录结果
  6. 如有需要,本地下载XNL文件
 

此示例代码显示解析PDF文档以提取表单字段为XML


using Aspose.Pdf.Cloud.Sdk.Model;

namespace Parser
{
    public class ExportFormToXML
    {
        public static async Task Extract(string documentName, string outputXMLName, string remoteFolder)
        {
		// Get your AppSid and AppSecret from https://dashboard.aspose.cloud (free registration required). 
		pdfApi = new PdfApi(AppSecret, AppSid);

                using (var file = File.OpenRead(Path.Combine(localFolder, documentName)))
		{ // Upload the local PDF to cloud storage folder name.
                    FilesUploadResult uploadResponse = await pdfApi.UploadFileAsync(Path.Combine(remoteFolder, documentName), documentName);
                    Console.WriteLine(uploadResponse.Uploaded[0]);
                }
                
                string xmlPath = Path.Combine(remoteFolder, outputXMLName);

                // Parse PDF to extract Form fields as XML in cloud storage.
                AsposeResponse response = await pdfApi.PutExportFieldsFromPdfToXmlInStorageAsync(documentName, xmlPath, folder: remoteFolder);

                // Checks the response and logs the result.
                if (response == null)
                    Console.WriteLine("ExportFormToXML(): Unexpected error!");
                else if (response.Code < 200 || response.Code > 299)
                    Console.WriteLine("ExportFormToXML(): Failed to export Pdf document form fields.");
                else
                { // Downloads the updated file for local use.
                    Console.WriteLine("ExportFormToXML(): Pdf document '{0}' form fields successfully exported to '{1} file.", documentName, outputXMLName);
                    Stream stream = pdfApi.DownloadFile(Path.Combine(remoteFolder, outputXMLName));
                    using var fileStream = File.Create(Path.Combine(localFolder, outputXMLName));
                    stream.Position = 0;
                    await stream.CopyToAsync(fileStream);
                    Console.WriteLine("ExportFormToXML(): File '{0}' successfully downloaded.", outputXMLName);

                }
            }
        }
    }
 

通过.NET SDK处理PDF中的表单解析

通过解析PDF文档以提取表单字段为XML,可以系统地验证每个表单字段的有效性和相关性,确保所有引用都是最新和有效的。对于下载表单字段为XML或进行批量分析等任务,提取表单字段可以实现自动化,节省时间并减少手动工作。 使用Aspose.PDF Cloud .NET SDK解析PDF文档以提取表单字段为XML。

使用我们的.NET SDK,您可以

  • 在PDF文档中添加文本或图像格式的页眉和页脚。
  • 向PDF文档添加表格和文本或图像印章。
  • 将多个PDF文档追加到现有文件。
  • 处理PDF附件、注释和表单字段。
  • 对PDF文档应用加密或解密并设置密码。
  • 删除页面或整个PDF文档中的所有印章和表格。
  • 根据ID从PDF文档中删除特定的印章或表格。
  • 替换PDF页面或整个文档中的单个或多个文本实例。
  • 广泛支持将PDF文档转换为各种其他文件格式。
  • 提取PDF文件的各种元素并优化PDF文档。
  • 您可以试用我们的免费应用来测试功能。

  •