PNG JPG BMP TIFF PDF

استخراج الروابط من PDF في Python SDK

استخراج الروابط إلى وثيقة PDF باستخدام Cloud Python SDK.

كيفية استخراج الروابط من PDF عبر Cloud Python SDK

للحصول على الروابط من PDF، سنستخدم Aspose.PDF Cloud Python SDK. هذا SDK السحابي يساعد مبرمجي Python في تطوير تطبيقات إنشاء وتوضيح وتحرير وتحويل مستندات PDF المستندة إلى السحابة باستخدام لغة البرمجة Python عبر Aspose.PDF REST API. ببساطة قم بإنشاء حساب في Aspose for Cloud واحصل على معلومات التطبيق الخاص بك. بمجرد أن يكون لديك App SID & key، أنت جاهز لاستخدام Aspose.PDF Cloud Python SDK. إذا كانت حزمة Python مستضافة على Github، يمكنك تثبيتها مباشرة من Github:

التثبيت من Github
     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

أمر وحدة التحكم في إدارة الحزم     
    pip install asposepdfcloud

خطوات استخراج الروابط من PDF عبر Python

يمكن لمطوري Aspose.PDF Cloud تحميل والحصول على الروابط من PDF بسهولة في بضع أسطر من التعليمات البرمجية.

تثبيت Python SDK
رفع مستند PDF إلى خادم Aspose Cloud
تنزيل مستند PDF المعالج من خادم Aspose Cloud
الحصول على جميع التعليقات التوضيحية للروابط التشعبية لمستند PDF معين
الحصول على تعليق توضيحي للروابط التشعبية باستخدام المعرف المحدد في مستند PDF

استخراج الروابط من PDF باستخدام Python
    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
        PAGE_NUMBER = 2
        LINK_FIND_ID = "GI5UO32UN5KVESKBMN2GS33OHMZTEMJMGUYDQLBTGYYCYNJSGE"


    class PdfLinks:
        """Class for managing PDF links using Aspose PDF Cloud API."""

        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """Initialize the API client."""
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"Failed to load credentials: {e}")

        def upload_document(self):
            """Upload a PDF document to the Aspose Cloud server."""
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"Failed to upload file: {e}")

        def show_links_array(self, links, prefix):
            for item in links:
                logging.info(f"{prefix} Link ID: '{item.id}' - Link Action: '{item.action}'")

        def get_all_links(self):
            """Get all hyperlink annotations for a specific PDF document."""
            if self.pdf_api:
                try:
                    response = self.pdf_api.get_page_link_annotations( Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
                    if response.code == 200:
                        self.show_links_array(response.links.list, "All: ")
                    else:
                        logging.error(f"Failed to add link to the page. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"Error while adding link: {e}")

        def get_link_by_id(self, link_id: str):
            """Get hyperlink annotation using the specific Id in PDF document."""
            if self.pdf_api:
                try:
                    result_link = self.pdf_api.get_link_annotation(Config.PDF_DOCUMENT_NAME, link_id)
                    if result_link.code == 200:
                        self.show_links_array([result_link.link], "Find: ")
                except Exception as e:
                    logging.error(f"Error while adding link: {e}")

    if __name__ == "__main__":
        pdf_links = PdfLinks()
        pdf_links.upload_document()
        pdf_links.get_all_links()
        pdf_links.get_link_by_id(Config.LINK_FIND_ID)

العمل مع الروابط في PDF

من خلال استخراج الروابط، يمكن التحقق بشكل منهجي من صحة وملاءمة كل عنوان URL، مما يضمن أن جميع المراجع حالية وقابلة للتنفيذ. لأغراض مثل تنزيل المستندات المرتبطة أو إجراء تحليلات دفعة، يتيح استخراج عناوين URL الأتمتة، مما يوفر الوقت ويقلل من الجهد اليدوي. احصل على الروابط من مستندات PDF باستخدام Aspose.PDF Cloud Python SDK.

مع مكتبتنا الخاصة بـ Python يمكنك:

دمج مستندات PDF.
تقسيم ملفات PDF.
تحويل PDF إلى تنسيقات أخرى، والعكس بالعكس.
التعامل مع التعليقات التوضيحية.
العمل مع الصور في PDF، إلخ.
يمكنك تجربة تطبيقنا المجاني لاختبار الوظائف عبر الإنترنت.

استخراج الروابط من PDF في Python SDK

استخراج الروابط إلى وثيقة PDF باستخدام Cloud Python SDK.

Aspose.PDF Cloud SDK for Python

Overview

كيفية استخراج الروابط من PDF عبر Cloud Python SDK

التثبيت من Github

أمر وحدة التحكم في إدارة الحزم

خطوات استخراج الروابط من PDF عبر Python

استخراج الروابط من PDF باستخدام Python

العمل مع الروابط في PDF