HTML JPG PDF XML DOCX
  Product Family
PDF

通过 PDf.Cloud Python SDK 从 PDF 获取链接

使用服务器端 Python API 从 PDF 文档中获取链接的 API。

Get Started

如何使用云端 Python SDK 从 PDF 文档中提取链接注释

要从 PDF 获取链接,我们将使用 Aspose.PDF Cloud Python SDK。此云 SDK 协助 Python 程序员使用 Python 编程语言通过 Aspose.PDF REST API 开发基于云的 PDF 创建器、注释器、编辑器和转换器应用程序。只需在 Aspose for Cloud 创建一个帐户并获取您的应用程序信息。一旦您拥有了 App SID 和密钥,您就可以开始使用 Aspose.PDF Cloud Python SDK。如果 Python 包托管在 Github 上,您可以直接从 Github 安装:

从 Github 安装



    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

包管理器控制台命令


    pip install asposepdfcloud

使用 Python SDK 通过 Id 获取链接的步骤

Aspose.PDF Cloud 开发人员可以轻松从 PDF 文档中通过 Id 提取链接注释。开发人员只需几行代码。

  1. 安装 Python SDK
  2. 使用您的应用程序密钥和密钥创建一个新的配置对象
  3. 创建一个对象以连接到云 API
  4. 上传您的文档文件
  5. 使用 GetLinkAnnotation 函数从 PDF 文档中通过 Id 提取链接注释
  6. 检查响应并记录结果
  7. 如果操作成功,您可以打印链接注释或以其他方式使用链接注释
 

此示例代码显示如何从 PDF 文档中通过 Id 获取链接注释

    
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"..\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
        PAGE_NUMBER = 2
        LINK_FIND_ID = "GI5UO32UN5KVESKBMN2GS33OHMZTEMJMGUYDQLBTGYYCYNJSGE"


    class PdfLinks:
        """Class for managing PDF links using Aspose PDF Cloud API."""

        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """Initialize the API client."""
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"Failed to load credentials: {e}")

        def upload_document(self):
            """Upload a PDF document to the Aspose Cloud server."""
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"Failed to upload file: {e}")

        def show_links_array(self, links, prefix):
            for item in links:
                logging.info(f"{prefix} Link ID: '{item.id}' - Link Action: '{item.action}'")

        def get_link_by_id(self, link_id: str):
            """Get hyperlink annotation using the specific Id in PDF document."""
            if self.pdf_api:
                try:
                    result_link = self.pdf_api.get_link_annotation(Config.PDF_DOCUMENT_NAME, link_id)
                    if result_link.code == 200:
                        self.show_links_array([result_link.link], "Find: ")
                except Exception as e:
                    logging.error(f"Error while adding link: {e}")

    if __name__ == "__main__":
        pdf_links = PdfLinks()
        pdf_links.upload_document()
        pdf_links.get_link_by_id(Config.LINK_FIND_ID)
 

通过 Python SDK 处理 PDF 中的链接

通过提取链接,可以系统地验证每个 URL 的有效性和相关性,确保所有引用都是当前的且功能正常。对于下载链接文档或进行批量分析等任务,提取 URL 使自动化成为可能,节省时间并减少人工工作。 使用 Aspose.PDF Cloud Python SDK 从 PDF 文档中提取链接。

使用我们的 Python SDK,您可以

  • 以文本或图像格式添加 PDF 文档的页眉和页脚。
  • 向 PDF 文档添加表格和文本或图像印章。
  • 将多个 PDF 文档附加到现有文件。
  • 处理 PDF 附件、注释和表单字段。
  • 对 PDF 文档进行加密或解密并设置密码。
  • 从页面或整个 PDF 文档中删除所有印章和表格。
  • 根据其 ID 从 PDF 文档中删除特定印章或表格。
  • 替换 PDF 页面上或整个文档中的单个或多个文本实例。
  • 广泛支持将 PDF 文档转换为各种其他文件格式。
  • 提取 PDF 文件的各种元素并优化 PDF 文档。
  • 您可以尝试我们的 免费应用 来测试功能。

  •