HTML JPG PDF XML DOCX
  Product Family
PDF

在 Python SDK 中获取 PDF 表单

使用 Python 云 SDK 获取 PDF 文档中所有表单字段

Get Started

通过云 Python SDK 从 PDF 文档获取 AcroForms

为了从 PDF 获取 AcroForms,我们将使用 Aspose.PDF Cloud Python SDK。该云 SDK 帮助 Python 程序员使用 Python 编程语言通过 Aspose.PDF REST API 开发基于云的 PDF 创建、标注、编辑、转换和 AcroForm 应用。只需在 Aspose for Cloud 创建账户并获取应用信息。拥有 App SID 和密钥后,即可使用 Aspose.PDF Cloud Python SDK。

从 Github 安装


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

包管理器控制台命令

     
    pip install asposepdfcloud

使用 Python 获取 AcroForms 的步骤

Aspose.PDF Cloud 开发者可以仅用几行代码轻松加载并获取 PDF 中的 AcroForms。

  1. 将 PDF 文件上传至 Aspose.PDF Cloud 服务。
  2. 记录文件上传过程中出现的任何错误。
  3. 从 Aspose.PDF Cloud 存储中检索 PDF 文件的表单字段。
  4. 遍历表单字段并将字段名称和数值记录到控制台。
  5. 记录字段检索过程中出现的任何错误
  6. 如有需要,下载结果
 

此示例代码展示了使用 Python 从 PDF 文档获取 AcroForms


import os
import logging
from pathlib import Path
from asposepdfcloud import PdfApi, FieldsResponse

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

class PdfAcroforms:
    def __init__():
        """Initialize the API client."""
        credentials_file = Path(r"..\credentials.json")
        with credentials_file.open("r", encoding="utf-8") as file:
            credentials = json.load(file)
        api_key, app_id = credentials.get("key"), credentials.get("id")
         = PdfApi(ApiClient(api_key, app_id))

    def getField(self, documentName: str, localFolder: Path, remoteFolder: str):
        """ Upload a local fileName to the Aspose Cloud server. """
        file_path = localFolder / documentName
        self.pdf_api.upload_file(os.path.join(remoteFolder, fileName), file_path)

        try:
            response: FieldsResponse = self.pdf_api.get_fields(documentName, folder=remoteFolder)
            if response.code == 200:
                for field in response.fields.list:
                    logging.info(f"PdfAcroforms(): Form filed '{field}'.")
            else:
                logging.error(f"PdfAcroforms(): Failed to get form fileds from document. Response code: {response.code}")
        except Exception as e:
            logging.error(f"PdfAcroforms(): Error while extracting form field: {e}")
 

通过 Python SDK 使用 AcroForms

提取 AcroForm 数据可让您高效地汇总和分析用户收集的信息,例如调查或申请表的响应。检索到的 AcroForm 数据可以集成到数据库、电子表格或其他系统中,以便进一步处理或存档。提取 AcroForms 有助于审计已填写的表单,以验证所提供数据的准确性、真实性或完整性。在将表单迁移至其他文档管理系统或进行备份时,检索 AcroForms 是必不可少的。 使用 Aspose.PDF Cloud Python SDK 从 PDF 文档获取 AcroForms。

使用我们的 Python 库,您可以

  • 以文本或图像格式为 PDF 文档添加页眉和页脚。
  • 向 PDF 文档添加表格和印章(文本或图像)。
  • 将多个 PDF 文档追加到现有文件中。
  • 处理 PDF 附件、批注和表单字段。
  • 对 PDF 文档进行加密或解密并设置密码。
  • 删除页面或整个 PDF 文档中的所有印章和表格。
  • 按 ID 删除 PDF 文档中的特定印章或表格。
  • 替换 PDF 页面或整个文档中的单个或多个文本实例。
  • 广泛支持将 PDF 文档转换为多种其他文件格式。
  • 提取 PDF 文件的各种元素并对 PDF 文档进行优化。
  • 您可以试用我们的 免费应用 在线获取 PDF 文件的 AcroForms 并测试功能。