HTML JPG PDF XML DOCX
  Product Family
PDF

تحليل ملفات PDF لاستخراج النص بالاسم في Python SDK

API لتحليل مستندات PDF لاستخراج النص بالاسم باستخدام API بايثون على الخادم.

Get Started

كيفية تحليل مستندات PDF لاستخراج النص بالاسم باستخدام Cloud Python SDK

لتحليل مستندات PDF لاستخراج النص بالاسم عبر Cloud Python SDK، سنستخدم Aspose.PDF Cloud Python SDK يساعد هذا الـCloud SDK مبرمجي بايثون في تطوير تطبيقات إنشاء وتحرير وتحويل وتحليل ملفات PDF المستندة إلى السحابة باستخدام لغة البرمجة بايثون عبر Aspose.PDF REST API. ببساطة، أنشئ حسابًا في Aspose for Cloud واحصل على معلومات تطبيقك. بمجرد الحصول على App SID والمفتاح، تكون جاهزًا لتجربة Aspose.PDF Cloud Python SDK. إذا كانت حزمة بايثون مستضافة على Github، يمكنك التثبيت مباشرة من Github:

التثبيت من Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
     
     

خطوات تحليل PDF لاستخراج النص بالاسم باستخدام Python SDK

يمكن لمطوري Aspose.PDF Cloud تحليل مستندات PDF بسهولة لاستخراج النص بالاسم. يحتاج المطورون إلى بضع سطور من الشيفرة فقط.

  1. إنشاء كائن تكوين جديد باستخدام مفتاح وتطبيقك السري
  2. إنشاء كائن للاتصال بـCloud API
  3. تحميل ملف المستند الخاص بك
  4. تحليل مستندات PDF لاستخراج النص بالاسم في تخزين السحابة باستخدام وظيفة get_text_box_field
  5. تحقق من الاستجابة وسجل النتيجة
  6. تنزيل معلومات مربع النص في ملف JSON محليًا إذا لزم الأمر
 

توضح هذه الشيفرة النموذجية تحليل مستند PDF لاستخراج النص بالاسم


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractTextBox:
    """Class for extracting text box from PDF document using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

   def Extract(self, documentName: str, texxtboxName: str, localFolder: Path, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
	response = self.pdf_api.get_text_box_field(documentName, textboxName, **opts)
        if response.code != 200:
            logging.error("ParseExtractTextBox(): Unexpected error!")
        else:
	    logging.info(f"ParseExtractTextBox(): TextBox field '{textboxName}' successfully extracted from the document '{documentName}'.")
            localJsonFile = str(Path.joinpath(localFolder, "text_box_objects.json"))
            with open(localJsonFile, "w", encoding="utf-8") as localFile:            
               jsText = json.dumps(response.field.__dict__, ensure_ascii=False, default=str, indent=4)
               localFile.write(jsText)
 

العمل مع تحليل النص في PDF عبر Python SDK

من خلال تحليل مستندات PDF لاستخراج النص بالاسم، يمكنك تعديل محتوى حقل TextBox حسب الحاجة. يحافظ هذا على موقع النص في المستندات بينما يوفر الوقت ويقلل من العمل اليدوي. تحليل مستندات PDF لاستخراج النص بالاسم باستخدام Aspose.PDF Cloud Python SDK.

مع Python SDK لدينا يمكنك

  • إضافة رأس وتذييل مستند PDF بتنسيق نص أو صورة.
  • إضافة جداول وطوابع نص أو صورة إلى مستندات PDF.
  • إلحاق مستندات PDF متعددة بملف موجود.
  • العمل مع مرفقات PDF والتعليقات التوضيحية وحقول النموذج.
  • تطبيق التشفير أو فك التشفير على مستندات PDF وتعيين كلمة مرور.
  • حذف جميع الطوابع والجداول من صفحة أو مستند PDF بالكامل.
  • حذف طابع أو جدول معين من مستند PDF بواسطة معرفه.
  • استبدال نص أو أكثر من صفحة PDF أو من المستند بأكمله.
  • دعم واسع لتحويل مستندات PDF إلى تنسيقات ملفات أخرى متنوعة.
  • استخراج عناصر متنوعة من ملفات PDF وجعل مستندات PDF محسّنة.
  • يمكنك تجربة تطبيقنا المجاني لاختبار الوظائف.

  •