HTML JPG PDF XML DOCX
  Product Family
PDF

Phân tích PDF để trích xuất các trường biểu mẫu dưới dạng FDF trong Python SDK

API để phân tích tài liệu PDF nhằm trích xuất các trường biểu mẫu dưới dạng FDF bằng cách sử dụng API Python phía máy chủ.

Get Started

Cách phân tích tài liệu PDF để trích xuất các trường biểu mẫu dưới dạng FDF bằng Cloud Python SDK

Để phân tích tài liệu PDF nhằm trích xuất các trường biểu mẫu dưới dạng FDF qua Cloud Python SDK, chúng ta sẽ sử dụng Aspose.PDF Cloud Python SDK Cloud SDK này hỗ trợ các lập trình viên Python phát triển các ứng dụng tạo, chú thích, chỉnh sửa, chuyển đổi và phân tích PDF trên đám mây bằng ngôn ngữ lập trình Python qua Aspose.PDF REST API. Chỉ cần tạo một tài khoản tại Aspose for Cloud và lấy thông tin ứng dụng của bạn. Khi bạn đã có App SID & key, bạn đã sẵn sàng sử dụng Aspose.PDF Cloud Python SDK. Nếu gói python được lưu trữ trên Github, bạn có thể cài đặt trực tiếp từ Github:

Cài đặt từ Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
     

Lệnh trong Package Manager Console

     
    pip install asposepdfcloud

Các bước để phân tích PDF nhằm trích xuất các trường biểu mẫu dưới dạng FDF bằng Python SDK

Các nhà phát triển Aspose.PDF Cloud có thể dễ dàng phân tích tài liệu PDF để trích xuất các trường biểu mẫu dưới dạng FDF. Các nhà phát triển chỉ cần vài dòng mã.

  1. Tạo một đối tượng Cấu hình mới với bí mật và khóa Ứng dụng của bạn
  2. Tạo một đối tượng để kết nối với Cloud API
  3. Tải lên tệp tài liệu của bạn
  4. Phân tích tài liệu PDF để trích xuất các trường biểu mẫu dưới dạng FDF trong lưu trữ đám mây bằng hàm put_export_fields_from_pdf_to_fdf_in_storage
  5. Kiểm tra phản hồi và ghi nhận kết quả
  6. Tải xuống tệp FDF về máy nếu cần
 

Mã mẫu này cho thấy cách phân tích tài liệu PDF để trích xuất các trường biểu mẫu dưới dạng FDF


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ExportFormToFDF:
    """Class for extracting PDF form fields into FDF using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

    def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str,  output_prefix: str):
        """Download the processed PDF document from the Aspose Cloud server."""
        if self.pdf_api:
            try:
                temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
                local_path = localFolder / ( output_prefix + outputDocument )
                shutil.move(temp_file, str(local_path))
                logging.info(f"download_result(): File successfully downloaded: {local_path}")
            except Exception as e:
                logging.error(f"download_result(): Failed to download file: {e}")


    def Extract(self, documentName: str, outputFDFName: str, localFolder: Path, remoteFolder: str ):
        self.uploadDocument(documentName, remoteFolder)

        fdfPath = str(Path.joinpath(Path(remoteFolder), outputFDFName))
        opts = {
            "folder": remoteFolder
        }
        response = self.pdf_api.put_export_fields_from_pdf_to_fdf_in_storage(documentName, fdfPath, **opts)
        if response.code != 200:
            logging.error("ExportFormToFDF(): Unexpected error!")
        else:
            logging.info(f"ExportFormToFDF(): Pdf document '{documentName}' form fields successfully exported to '{outputFDFName}' file.")
            self.helper.downloadFile(outputFDFName, outputFDFName, localFolder, remoteFolder, "")
 

Làm việc với việc phân tích Biểu mẫu trong PDF qua Python SDK

Bằng cách phân tích tài liệu PDF để trích xuất các trường biểu mẫu dưới dạng FDF, người dùng có thể kiểm tra một cách hệ thống tính hợp lệ và sự liên quan của mỗi trường biểu mẫu, đảm bảo rằng tất cả các tham chiếu đều hiện hành và hoạt động.​ Đối với các nhiệm vụ như tải xuống các trường biểu mẫu dưới dạng FDF hoặc thực hiện phân tích hàng loạt, việc trích xuất các trường biểu mẫu cho phép tự động hóa, tiết kiệm thời gian và giảm công sức thủ công. Phân tích tài liệu PDF để trích xuất các trường biểu mẫu dưới dạng FDF với Aspose.PDF Cloud Python SDK.

Với SDK Python của chúng tôi, bạn có thể

  • Thêm tiêu đề & chân trang tài liệu PDF dưới dạng văn bản hoặc hình ảnh.
  • Thêm bảng & dấu văn bản hoặc hình ảnh vào tài liệu PDF.
  • Ghép nhiều tài liệu PDF vào một tệp hiện có.
  • Làm việc với tệp đính kèm PDF, chú thích & trường biểu mẫu.
  • Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
  • Xóa tất cả các dấu & bảng khỏi một trang hoặc toàn bộ tài liệu PDF.
  • Xóa một dấu hoặc bảng cụ thể khỏi tài liệu PDF theo ID của nó.
  • Thay thế một hoặc nhiều trường hợp văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
  • Hỗ trợ mở rộng cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác.
  • Trích xuất các phần tử khác nhau của tệp PDF & tối ưu hóa tài liệu PDF.
  • Bạn có thể dùng thử Ứng dụng miễn phí của chúng tôi để kiểm tra chức năng.

  •