HTML JPG PDF XML DOCX
  Product Family
PDF

تحليل PDF لاستخراج النصوص في مجموعة أدوات جافا

واجهة برمجة التطبيقات لتحليل مستندات PDF لاستخراج النصوص باستخدام API جافا من جانب الخادم.

Get Started

كيفية تحليل مستندات PDF لاستخراج النصوص باستخدام مجموعة أدوات جافا السحابية

لتحليل مستندات PDF لاستخراج النصوص عبر مجموعة أدوات جافا السحابية، سنستخدم Aspose.PDF Cloud Java SDK تتيح لك مجموعة أدوات جافا السحابية بناء تطبيقات إنشاء وتحرير وتحويل ملفات PDF على السحابة بلغة جافا لمختلف منصات السحابة بسهولة. افتح المستودع مدير الحزم، ابحث عن Aspose.PDF Cloud ثم قم بالتثبيت. يمكنك أيضًا استخدام الأمر التالي من وحدة تحكم مدير الحزم لتثبيته باستخدام Maven.

أضف مستودع Aspose Cloud إلى ملف pom.xml الخاص بتطبيقك

أضف مستودع Aspose Cloud


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

لتثبيت مكتبة عميل API في مستودع Maven المحلي الخاص بك، فقط نفّذ الأمر التالي:

التثبيت من Github


    mvn clean install

لنشره إلى مستودع Maven بعيد بدلاً من ذلك، قم بتكوين إعدادات المستودع ونفّذ الأمر التالي:

نشر مستودع Maven


    mvn clean deploy

خطوات تحليل PDF لاستخراج النصوص باستخدام مجموعة أدوات جافا

يمكن لمطوري Aspose.PDF Cloud بسهولة تحليل مستندات PDF لاستخراج النصوص. يحتاج المطورون إلى بضع أسطر فقط من الشيفرة.

  1. إنشاء كائن Configuration جديد باستخدام سر التطبيق والمفتاح الخاصين بك
  2. إنشاء كائن للاتصال بواجهة برمجة تطبيقات السحابة
  3. تحميل ملف المستند الخاص بك
  4. تحليل مستندات PDF لاستخراج النصوص في التخزين السحابي باستخدام دالة getDocumentTextBoxFields
  5. فحص الاستجابة وتسجيل النتيجة
  6. إذا نجحت العملية، اطبع النصوص المستخرجة
 

يعرض هذا العينة من الكود تحليل مستند PDF لاستخراج النصوص


    import java.io.File;
    import java.nio.file.Files;
    import java.nio.file.OpenOption;
    import java.nio.file.StandardOpenOption;
    import java.nio.file.Path;
    import com.google.gson.Gson;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TextBoxField;
    import com.aspose.asposecloudpdf.model.TextBoxFieldsResponse;

    public class ParseGetTextBoxes {
        public static void extract() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
	    String OUTPUT_FILE     = "parsed_text_box_fields_output.json";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // perform action
                TextBoxFieldsResponse response = pdfApi.getDocumentTextBoxFields(PDF_DOCUMENT, null,  REMOTE_FOLDER);
                System.out.println("TextBox fields extracted status: " + response.getStatus());

                String jsonResult = "[\n";
                for (TextBoxField fieldDef : response.getFields().getList()) {
                    String jsonFiled = new Gson().toJson(fieldDef);
                    jsonResult += jsonFiled + ",\n\n";
                }
                jsonResult +="]";

                // save json
                Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
                byte[] strToBytes = jsonResult.getBytes();
                Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
		
                System.out.println("TextBox fields successfully extracted to: '" + path + "'");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

العمل مع تحليل النص في PDF عبر مجموعة أدوات جافا

من خلال تحليل مستندات PDF لاستخراج النصوص، يمكنك تعديل محتوى حقول TextBox حسب الحاجة. هذا يحافظ على موضع النص في المستندات مع توفير الوقت وتقليل العمل اليدوي. قم بتحليل مستندات PDF لاستخراج النصوص باستخدام Aspose.PDF Cloud Java SDK.

مع مجموعة أدوات جافا الخاصة بنا يمكنك

  • إضافة رأس وتذييل مستند PDF بنص أو صورة.
  • إضافة جداول وختم نص أو صورة إلى مستندات PDF.
  • إلحاق مستندات PDF متعددة إلى ملف موجود.
  • التعامل مع مرفقات PDF، التعليقات التوضيحية، وحقول النماذج.
  • تطبيق التشفير أو فك التشفير على مستندات PDF وتعيين كلمة مرور.
  • حذف جميع الطوابع والجداول من صفحة أو مستند PDF كامل.
  • حذف طابع أو جدول محدد من مستند PDF حسب المعرف الخاص به.
  • استبدال نسخة واحدة أو متعددة من النص على صفحة PDF أو من المستند بالكامل.
  • دعم شامل لتحويل مستندات PDF إلى صيغ ملفات أخرى متنوعة.
  • استخراج عناصر متنوعة من ملفات PDF وجعل مستندات PDF محسّنة.
  • يمكنك تجربة التطبيق المجاني لاختبار الوظيفة.

  •