HTML JPG PDF XML DOCX
  Product Family
PDF

تحليل ملفات PDF لاستخراج النصوص في Go SDK

API لتحليل مستندات PDF لاستخراج النصوص باستخدام API Go على الخادم.

Get Started

كيفية تحليل مستندات PDF لاستخراج النصوص باستخدام Cloud Go SDK

لتحليل مستندات PDF لاستخراج النصوص عبر Cloud Go SDK، سنستخدم Aspose.PDF Cloud Go SDK يساعد هذا Cloud Go SDK المبرمجين بلغة Go في تطوير تطبيقات إنشاء وتعليق وتحرير وتحويل وتحليل ملفات PDF المستندة إلى السحابة باستخدام لغة البرمجة Go عبر Aspose.PDF REST API. استخدم الأمر التالي من وحدة تحكم مدير الحزم.

أمر وحدة تحكم مدير الحزم


     
    go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
     
     

خطوات تحليل ملفات PDF لاستخراج النصوص باستخدام Go SDK

يمكن لمطوري Aspose.PDF Cloud بسهولة تحليل مستندات PDF لاستخراج النصوص. يحتاج المطورون إلى بضع سطور فقط من الكود.

  1. إنشاء كائن تكوين جديد باستخدام المفتاح السري والتطبيق الخاص بك
  2. إنشاء كائن للاتصال بواجهة برمجة تطبيقات السحابة
  3. تحميل ملف المستند الخاص بك
  4. تحليل مستندات PDF لاستخراج النصوص في تخزين السحابة باستخدام دالة GetDocumentTextBoxFields
  5. التحقق من الاستجابة وتسجيل النتيجة
  6. تنزيل معلومات مربعات النص كملف JSON محليًا إذا لزم الأمر
 

يوضح هذا الكود المثال كيفية تحليل مستند PDF لاستخراج النصوص


package main

import (
	"encoding/json"
	"fmt"
	"os"
	"path"

	asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)

// Extract text boxes form the document
func ParseExtractTextBoxes(documentName string, localFolder string, remoteFolder string) {
	// Get your AppSecret and Key from https://dashboard.aspose.cloud (free registration required).
	pdf_api := asposepdfcloud.NewPdfApiService(APP_SID, APP_KEY, "")

	args := map[string]interface{}{
		"folder": remoteFolder,
	}

	file, _ := os.Open(path.Join(localFolder, documentName))	
	_, _, _ = pdf_api.UploadFile(path.Join(remoteFolder, documentName), file, args)

	result, httpResponse, err := pdf_api.GetDocumentTextBoxFields(documentName, args)
	if err != nil {
		fmt.Println(err.Error())
	} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
		fmt.Println("ParseExtractTextBoxes(): Failed to extract text boxes from the document.")
	} else {
		if result.Fields == nil || len(result.Fields.List) == 0 {
			fmt.Println("ParseExtractTextBoxes(): Text boxes not found in the document.")
		} else {
			resultJson := "[\n"
			for _, textBox := range result.Fields.List {
				fmt.Println("TextBox", textBox)
				jsTable, _ := json.Marshal(textBox)
				resultJson += string(jsTable) + ",\n\n"
			}
			resultJson += "]"
			fileName := path.Join(localFolder, ("parsed_taext_boxes_output_go.json"))
			f, _ := os.Create(fileName)
			_, _ = f.Write([]byte(resultJson))
			fmt.Println("File '" + fileName + "' successfully downloaded.")
		}
	}
}
 

العمل مع تحليل النص في PDF عبر Go SDK

من خلال تحليل مستندات PDF لاستخراج النصوص، يمكنك تعديل محتوى حقول TextBox حسب الحاجة. هذا يحافظ على موضع النص في المستندات مع توفير الوقت وتقليل العمل اليدوي. تحليل مستندات PDF لاستخراج النصوص باستخدام Aspose.PDF Cloud Go SDK.

مع Go SDK الخاص بنا يمكنك

  • إضافة رأس وتذييل للمستند PDF بتنسيق نصي أو صورة.
  • إضافة جداول ودمغات نصية أو صور إلى مستندات PDF.
  • إلحاق مستندات PDF متعددة بملف موجود.
  • العمل مع مرفقات وتعليقات وحقول النماذج في PDF.
  • تطبيق التشفير أو فك التشفير على مستندات PDF وضبط كلمة مرور.
  • حذف جميع الدمغات والجداول من صفحة أو مستند PDF بالكامل.
  • حذف دمغة أو جدول معين من مستند PDF بواسطة معرّفه.
  • استبدال مثيل واحد أو عدة مثيلات للنص في صفحة PDF أو من المستند بأكمله.
  • دعم واسع لتحويل مستندات PDF إلى تنسيقات ملفات أخرى مختلفة.
  • استخراج عناصر مختلفة من ملفات PDF وجعل مستندات PDF محسنة.
  • يمكنك تجربة التطبيق المجاني لاختبار الوظيفة.

  •