PNG JPG BMP TIFF PDF
Aspose.PDF  for Python

Ekstrak Tautan dari PDF di Python SDK

Ekstrak Tautan ke Dokumen PDF menggunakan Cloud Python SDK.

Get Started

Cara Mengekstrak Tautan dari PDF melalui Cloud Python SDK

Untuk mendapatkan tautan dari PDF, kita akan menggunakan Aspose.PDF Cloud Python SDK. Cloud SDK ini membantu programmer Python dalam mengembangkan aplikasi pembuat, anotator, editor, dan konverter PDF berbasis cloud menggunakan bahasa pemrograman Python melalui Aspose.PDF REST API. Cukup buat akun di Aspose for Cloud dan dapatkan informasi aplikasi Anda. Setelah Anda memiliki App SID & key, Anda siap untuk menggunakan Aspose.PDF Cloud Python SDK. Jika paket Python dihosting di Github, Anda dapat menginstal langsung dari Github:

Instalasi dari Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

Perintah Konsol Manajer Paket

     
    pip install asposepdfcloud

Langkah-langkah Mengekstrak Tautan dari PDF melalui Python

Pengembang Aspose.PDF Cloud dapat dengan mudah memuat & mendapatkan tautan dari PDF hanya dalam beberapa baris kode.

  1. Instal Python SDK
  2. Unggah dokumen PDF ke server Aspose Cloud
  3. Unduh dokumen PDF yang telah diproses dari server Aspose Cloud
  4. Dapatkan semua anotasi hyperlink untuk dokumen PDF tertentu
  5. Dapatkan anotasi hyperlink menggunakan Id tertentu dalam dokumen PDF
 

Ekstrak Tautan dari PDF menggunakan Python


    import shutil
    import json
    import logging
    from pathlib import Path
    from asposepdfcloud import ApiClient, PdfApi

    # Configure logging
    logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


    class Config:
        """Configuration parameters."""
        CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
        LOCAL_FOLDER = Path(r"C:\Samples")
        PDF_DOCUMENT_NAME = "sample.pdf"
        LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
        PAGE_NUMBER = 2
        LINK_FIND_ID = "GI5UO32UN5KVESKBMN2GS33OHMZTEMJMGUYDQLBTGYYCYNJSGE"


    class PdfLinks:
        """Class for managing PDF links using Aspose PDF Cloud API."""

        def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
            self.pdf_api = None
            self._init_api(credentials_file)

        def _init_api(self, credentials_file: Path):
            """Initialize the API client."""
            try:
                with credentials_file.open("r", encoding="utf-8") as file:
                    credentials = json.load(file)
                    api_key, app_id = credentials.get("key"), credentials.get("id")
                    if not api_key or not app_id:
                        raise ValueError("Error: Missing API keys in the credentials file.")
                    self.pdf_api = PdfApi(ApiClient(api_key, app_id))
            except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
                logging.error(f"Failed to load credentials: {e}")

        def upload_document(self):
            """Upload a PDF document to the Aspose Cloud server."""
            if self.pdf_api:
                file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
                try:
                    self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
                    logging.info(f"File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
                except Exception as e:
                    logging.error(f"Failed to upload file: {e}")

        def show_links_array(self, links, prefix):
            for item in links:
                logging.info(f"{prefix} Link ID: '{item.id}' - Link Action: '{item.action}'")

        def get_all_links(self):
            """Get all hyperlink annotations for a specific PDF document."""
            if self.pdf_api:
                try:
                    response = self.pdf_api.get_page_link_annotations( Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
                    if response.code == 200:
                        self.show_links_array(response.links.list, "All: ")
                    else:
                        logging.error(f"Failed to add link to the page. Response code: {response.code}")
                except Exception as e:
                    logging.error(f"Error while adding link: {e}")

        def get_link_by_id(self, link_id: str):
            """Get hyperlink annotation using the specific Id in PDF document."""
            if self.pdf_api:
                try:
                    result_link = self.pdf_api.get_link_annotation(Config.PDF_DOCUMENT_NAME, link_id)
                    if result_link.code == 200:
                        self.show_links_array([result_link.link], "Find: ")
                except Exception as e:
                    logging.error(f"Error while adding link: {e}")

    if __name__ == "__main__":
        pdf_links = PdfLinks()
        pdf_links.upload_document()
        pdf_links.get_all_links()
        pdf_links.get_link_by_id(Config.LINK_FIND_ID)
 

Bekerja dengan tautan di PDF

Dengan mengekstrak tautan, seseorang dapat secara sistematis memverifikasi keabsahan dan relevansi setiap URL, memastikan bahwa semua referensi saat ini dan berfungsi. Untuk tugas seperti mengunduh dokumen yang ditautkan atau melakukan analisis batch, mengekstraksi URL memungkinkan otomatisasi, menghemat waktu dan mengurangi upaya manual. Dapatkan tautan dari dokumen PDF dengan Aspose.PDF Cloud Python SDK.

Dengan perpustakaan Python kami Anda dapat:

  • Menggabungkan dokumen PDF.
  • Memisahkan File PDF.
  • Mengonversi PDF ke format lain, dan sebaliknya.
  • Memanipulasi Anotasi.
  • Bekerja dengan Gambar dalam PDF, dll.
  • Anda dapat mencoba Aplikasi gratis kami untuk menguji fungsionalitasnya secara online.