HTML JPG PDF XML DOCX
  Product Family
PDF

Nhận dấu trang theo đường dẫn từ PDF trong Python SDK

API để lấy dấu trang theo đường dẫn từ tài liệu PDF sử dụng API Python phía máy chủ.

Get Started

Cách trích xuất dấu trang theo đường dẫn từ tài liệu PDF sử dụng Cloud Python SDK

Để trích xuất Dấu trang theo đường dẫn từ PDF, chúng ta sẽ sử dụng Aspose.PDF Cloud Python SDK. SDK Đám mây này hỗ trợ các lập trình viên Python phát triển ứng dụng tạo, chú thích, chỉnh sửa và chuyển đổi PDF trên nền tảng đám mây sử dụng ngôn ngữ lập trình Python qua Aspose.PDF REST API. Chỉ cần tạo một tài khoản tại Aspose for Cloud và lấy thông tin ứng dụng của bạn. Khi bạn đã có App SID & key, bạn đã sẵn sàng sử dụng Aspose.PDF Cloud Python SDK. Nếu gói python được lưu trữ trên Github, bạn có thể cài đặt trực tiếp từ Github:

Cài đặt từ Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Các bước để lấy dấu trang theo đường dẫn sử dụng Python

Các nhà phát triển Aspose.PDF Cloud Python có thể dễ dàng trích xuất dấu trang theo đường dẫn từ tài liệu PDF. Các nhà phát triển chỉ cần vài dòng mã.

  1. Tạo một đối tượng Cấu hình mới với Bí mật Ứng dụng và Khóa của bạn
  2. Tạo một đối tượng để kết nối với API Đám mây
  3. Tải lên tệp tài liệu của bạn
  4. Trích xuất dấu trang theo đường dẫn từ tài liệu PDF sử dụng hàm GetBookmark
  5. Kiểm tra phản hồi và ghi lại kết quả
  6. Nếu hoạt động thành công, bạn có thể in dấu trang hoặc sử dụng dấu trang theo cách khác
 

Mã mẫu này cho thấy cách trích xuất dấu trang theo đường dẫn từ tài liệu PDF sử dụng PDF Cloud Python SDK


    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi, BookmarkResponse

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"..\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        BOOKMARK_PATH = "/5"

    class PdfBookmarks:
        """Class for managing PDF bookmarks using Aspose PDF Cloud API."""

        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """Initialize the API client."""
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"Failed to load credentials: {e}")

        def upload_document(self):
            """Upload a PDF document to the Aspose Cloud server."""
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"Failed to upload file: {e}")

        def get_bookmark(self):
            """Get bookmark for a specific PDF document using bookmark path."""    
            if self.pdf_api:
                try:
                    response : BookmarkResponse = self.pdf_api.get_bookmark( Config.PDF_DOCUMENT_NAME, Config.BOOKMARK_PATH)
                    if response.code == 200:
                        logging.info(f"Found bookmark => level: '{response.bookmark.level}' - action: '{response.bookmark.action}' - title: '{response.bookmark.title}'")
                    else:
                        logging.error(f"Failed to find bookmark for the document. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"Error while find bookmark: {e}")

    if __name__ == "__main__":
        pdf_bookmarks = PdfBookmarks()
        pdf_bookmarks.upload_document()
        pdf_bookmarks.get_bookmark()
 

Làm việc với dấu trang trong PDF qua Python SDK

Trích xuất dấu trang từ PDF cải thiện khả năng sử dụng tài liệu, tự động hóa xử lý nội dung và nâng cao khả năng tìm kiếm. Đặc biệt hữu ích cho các doanh nghiệp, nhà nghiên cứu và chuyên gia xử lý tài liệu PDF lớn hoặc có cấu trúc. Lấy các Dấu trang từ tài liệu PDF với Aspose.PDF Cloud Python SDK.

Với Python SDK của chúng tôi, bạn có thể

  • Thêm tiêu đề & chân trang của tài liệu PDF theo định dạng văn bản hoặc hình ảnh.
  • Thêm bảng & đóng dấu văn bản hoặc hình ảnh vào tài liệu PDF.
  • Thêm nhiều tài liệu PDF vào một tệp hiện có.
  • Làm việc với tệp đính kèm PDF, chú thích, & trường mẫu.
  • Áp dụng mã hóa hoặc giải mã cho tài liệu PDF & đặt mật khẩu.
  • Xóa tất cả các đóng dấu & bảng từ một trang hoặc toàn bộ tài liệu PDF.
  • Xóa một đóng dấu hoặc bảng cụ thể từ tài liệu PDF theo ID của nó.
  • Thay thế một hoặc nhiều trường hợp của văn bản trên một trang PDF hoặc từ toàn bộ tài liệu.
  • Hỗ trợ mở rộng cho việc chuyển đổi tài liệu PDF sang nhiều định dạng tệp khác.
  • Trích xuất nhiều thành phần của tệp PDF & làm tối ưu hóa tài liệu PDF.
  • Bạn có thể thử nghiệm ứng dụng miễn phí của chúng tôi để lấy dấu trang từ tệp PDF trực tuyến và kiểm tra chức năng.

  •