Удалить ссылки из PDF в Python SDK
Удалить ссылки из PDF-документа с помощью облачного Python SDK.
Get StartedКак удалить ссылки из PDF с помощью облачного Python SDK
Чтобы удалить ссылки из PDF, мы будем использовать Aspose.PDF Cloud Python SDK. Это облачное SDK помогает разработчикам на Python создавать облачные приложения для создания, аннотирования, редактирования и конвертации PDF с помощью API Aspose.PDF REST. Просто создайте учетную запись на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас будет App SID & ключ, вы готовы использовать Aspose.PDF Cloud Python SDK. Если пакет python размещен на Github, вы можете установить его прямо из Github:
Установка из Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Команда Package Manager Console
pip install asposepdfcloud
Шаги для удаления ссылок из PDF с помощью Python SDK
Разработчикам Aspose.PDF Cloud достаточно нескольких строк кода, чтобы легко загрузить и удалить ссылки из PDF.
- Установите Python SDK
- Загрузите PDF-документ на сервер Aspose Cloud
- Скачайте обработанный PDF-документ с сервера Aspose Cloud
- Получите все аннотации гиперссылок для конкретного PDF-документа
- Удалите все ссылки
Удаление ссылок из PDF с помощью Python
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi, AsposeResponse
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class Config:
"""Configuration parameters."""
CREDENTIALS_FILE = Path(r"C:\\Projects\\ASPOSE\\Pdf.Cloud\\Credentials\\credentials.json")
LOCAL_FOLDER = Path(r"C:\Samples")
PDF_DOCUMENT_NAME = "sample.pdf"
LOCAL_RESULT_DOCUMENT_NAME = "output_sample.pdf"
PAGE_NUMBER = 2
LINK_FIND_ID = "GI5UO32UN5KVESKBMN2GS33OHMZTEMJMGUYDQLBTGYYCYNJSGE"
class PdfLinks:
"""Class for managing PDF links using Aspose PDF Cloud API."""
def __init__(self, credentials_file: Path = Config.CREDENTIALS_FILE):
self.pdf_api = None
self._init_api(credentials_file)
def _init_api(self, credentials_file: Path):
"""Initialize the API client."""
try:
with credentials_file.open("r", encoding="utf-8") as file:
credentials = json.load(file)
api_key, app_id = credentials.get("key"), credentials.get("id")
if not api_key or not app_id:
raise ValueError("Error: Missing API keys in the credentials file.")
self.pdf_api = PdfApi(ApiClient(api_key, app_id))
except (FileNotFoundError, json.JSONDecodeError, ValueError) as e:
logging.error(f"Failed to load credentials: {e}")
def upload_document(self):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = Config.LOCAL_FOLDER / Config.PDF_DOCUMENT_NAME
try:
self.pdf_api.upload_file(Config.PDF_DOCUMENT_NAME, str(file_path))
logging.info(f"File {Config.PDF_DOCUMENT_NAME} uploaded successfully.")
except Exception as e:
logging.error(f"Failed to upload file: {e}")
def download_result(self):
"""Download the processed PDF document from the Aspose Cloud server."""
if self.pdf_api:
try:
temp_file = self.pdf_api.download_file(Config.PDF_DOCUMENT_NAME)
local_path = Config.LOCAL_FOLDER / Config.LOCAL_RESULT_DOCUMENT_NAME
shutil.move(temp_file, str(local_path))
logging.info(f"download_result(): File successfully downloaded: {local_path}")
except Exception as e:
logging.error(f"download_result(): Failed to download file: {e}")
def show_links_array(self, links, prefix):
for item in links:
logging.info(f"{prefix} Link ID: '{item.id}' - Link Action: '{item.action}'")
def get_all_links(self):
"""Get all hyperlink annotations for a specific PDF document."""
if self.pdf_api:
try:
response = self.pdf_api.get_page_link_annotations( Config.PDF_DOCUMENT_NAME, Config.PAGE_NUMBER)
if response.code == 200:
self.show_links_array(response.links.list, "All: ")
else:
logging.error(f"Failed to add link to the page. Response code: {response.code}")
except Exception as e:
logging.error(f"Error while adding link: No links found - {e}")
def remove_link_by_id(self):
if self.pdf_api:
response: AsposeResponse = self.pdf_api.delete_link_annotation(Config.PDF_DOCUMENT_NAME, Config.LINK_FIND_ID)
if response.code == 200:
logging.info("Link annotation with ID " + Config.LINK_FIND_ID + " has been removed.")
else:
logging.erro("Failed to remove link annotation with ID " + Config.LINK_FIND_ID)
if __name__ == "__main__":
pdf_links = PdfLinks()
pdf_links.upload_document()
pdf_links.get_all_links()
pdf_links.remove_link_by_id()
pdf_links.download_result()
Работа со ссылками в PDF
Со временем гиперссылки могут стать устаревшими или вести на несуществующие страницы. Такие сломанные ссылки могут раздражать читателей и снижать доверие к документу. Их удаление гарантирует, что контент остается точным и надежным. Удалите ссылки из PDF-документов с помощью Aspose.PDF Cloud Python SDK.
С нашей библиотекой Python вы можете:
- Объединять PDF-документы.
- Разделять PDF-файлы.
- Конвертировать PDF в другие форматы и обратно.
- Управлять аннотациями.
- Работать с изображениями в PDF и т.д.
- Вы можете попробовать наше бесплатное приложение для тестирования функционала онлайн.