HTML JPG PDF XML DOCX
  Product Family
PDF

تحليل ملف PDF لاستخراج الجدول بواسطة المعرف في Python SDK

API لتحليل مستندات PDF لاستخراج الجدول بواسطة المعرف باستخدام API بايثون من جانب الخادم.

Get Started

كيفية تحليل مستندات PDF لاستخراج الجدول بواسطة المعرف باستخدام Cloud Python SDK

لتحليل مستندات PDF لاستخراج الجدول بواسطة المعرف عبر Cloud Python SDK، سنستخدم Aspose.PDF Cloud Python SDK يساعد هذا Cloud SDK مبرمجي بايثون في تطوير تطبيقات منشئ PDF، ومُعلق، ومحرر، ومحول، ومحلل قائمة على السحابة باستخدام لغة البرمجة بايثون عبر Aspose.PDF REST API. ببساطة، قم بإنشاء حساب في Aspose for Cloud واحصل على معلومات التطبيق الخاصة بك. بمجرد حصولك على App SID & key، يمكنك البدء في استخدام Aspose.PDF Cloud Python SDK. إذا كانت حزمة بايثون مستضافة على Github، يمكنك التثبيت مباشرة من Github:

التثبيت من Github


     
    pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git

     
     

خطوات تحليل PDF لاستخراج الجدول بواسطة المعرف باستخدام Python SDK

يمكن لمطوري Aspose.PDF Cloud تحليل مستندات PDF بسهولة لاستخراج الجدول بواسطة المعرف. يحتاج المطورون إلى بضع أسطر فقط من التعليمات البرمجية.

  1. إنشاء كائن تكوين جديد باستخدام سر التطبيق والمفتاح
  2. إنشاء كائن للاتصال بـ Cloud API
  3. تحميل ملف المستند الخاص بك
  4. تحليل مستندات PDF لاستخراج الجدول بواسطة المعرف في تخزين السحابة باستخدام وظيفة get_table
  5. التحقق من الاستجابة وتسجيل النتيجة
  6. تنزيل معلومات الجدول في ملف JSON محلياً إذا لزم الأمر
 

يظهر هذا الرمز النموذجي تحليل مستند PDF لاستخراج الجدول بواسطة المعرف


import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging

# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")


class ParseExtractTable:
    """Class for extracting table from PDF document page using Aspose PDF Cloud API."""
    def __init__(self):
        self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)

    def upload_document(self, documentName: str, localFolder: str, remoteFolder: str):
        """Upload a PDF document to the Aspose Cloud server."""
        if self.pdf_api:
            file_path = localFolder / documentName
            try:
                if remoteFolder == None:
                    self.pdf_api.upload_file(documentName, str(file_path))
                else:
                    opts = { "folder": remoteFolder }
                    self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
                logging.info(f"File {documentName} uploaded successfully.")
            except Exception as e:
                logging.error(f"Failed to upload file: {e}")

   def extract(self, documentName: str, tableId: str, remoteFolder: Path):
        self.upload_document(documentName, remoteFolder)

        opts = {
            "folder": remoteFolder
        }
        
        response  = self.pdf_api.get_table(documentName, tableId, **opts)
        if response.code != 200:
            logging.error("ParseExtractTextBox(): Unexpected error!")
        else:
            logging.info(f"ParseExtractTable(): Table '{tableId}' successfully extracted from the document '{documentName}'.")
            localJsonFile = str(Path.joinpath(localFolder, "tables_objects.json"))
            with open(localJsonFile, "w", encoding="utf-8") as localFile:            
               jsText = json.dumps(response.table.__dict__, ensure_ascii=False, default=str, indent=4)
               localFile.write(jsText)
 

العمل مع تحليل الجدول بواسطة المعرف في PDF عبر Python SDK

من خلال تحليل مستندات PDF لاستخراج الجدول بواسطة المعرف، يمكنك تعديل محتوى الجدول بواسطة المعرف حسب الحاجة. هذا يحافظ على موضع الجدول في المستندات مع توفير الوقت وتقليل العمل اليدوي. تحليل مستندات PDF لاستخراج الجدول بواسطة المعرف باستخدام Aspose.PDF Cloud Python SDK.

مع Python SDK الخاص بنا يمكنك

  • إضافة رأس وتذييل مستند PDF بتنسيق نصي أو صورة.
  • إضافة جداول وأختام نصية أو صورية إلى مستندات PDF.
  • إلحاق مستندات PDF متعددة بملف موجود.
  • العمل مع مرفقات PDF، والتعليقات التوضيحية، وحقول النماذج.
  • تطبيق التشفير أو فك التشفير على مستندات PDF وتعيين كلمة مرور.
  • حذف جميع الأختام والجداول من صفحة أو مستند PDF بالكامل.
  • حذف ختم أو جدول محدد من مستند PDF بواسطة معرفه.
  • استبدال حالة واحدة أو متعددة من النص في صفحة PDF أو من المستند بأكمله.
  • دعم واسع لتحويل مستندات PDF إلى تنسيقات ملفات أخرى متنوعة.
  • استخراج عناصر مختلفة من ملفات PDF وجعل مستندات PDF محسنة.
  • يمكنك تجربة التطبيق المجاني لاختبار الوظائف.

  •