تحليل PDF لاستخراج النصوص في مجموعة أدوات جافا
واجهة برمجة التطبيقات لتحليل مستندات PDF لاستخراج النصوص باستخدام API جافا من جانب الخادم.
Get Startedكيفية تحليل مستندات PDF لاستخراج النصوص باستخدام مجموعة أدوات جافا السحابية
لتحليل مستندات PDF لاستخراج النصوص عبر مجموعة أدوات جافا السحابية، سنستخدم Aspose.PDF Cloud Java SDK تتيح لك مجموعة أدوات جافا السحابية بناء تطبيقات إنشاء وتحرير وتحويل ملفات PDF على السحابة بلغة جافا لمختلف منصات السحابة بسهولة. افتح المستودع مدير الحزم، ابحث عن Aspose.PDF Cloud ثم قم بالتثبيت. يمكنك أيضًا استخدام الأمر التالي من وحدة تحكم مدير الحزم لتثبيته باستخدام Maven.
أضف مستودع Aspose Cloud إلى ملف pom.xml الخاص بتطبيقك
أضف مستودع Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
لتثبيت مكتبة عميل API في مستودع Maven المحلي الخاص بك، فقط نفّذ الأمر التالي:
التثبيت من Github
mvn clean install
لنشره إلى مستودع Maven بعيد بدلاً من ذلك، قم بتكوين إعدادات المستودع ونفّذ الأمر التالي:
نشر مستودع Maven
mvn clean deploy
خطوات تحليل PDF لاستخراج النصوص باستخدام مجموعة أدوات جافا
يمكن لمطوري Aspose.PDF Cloud بسهولة تحليل مستندات PDF لاستخراج النصوص. يحتاج المطورون إلى بضع أسطر فقط من الشيفرة.
- إنشاء كائن Configuration جديد باستخدام سر التطبيق والمفتاح الخاصين بك
- إنشاء كائن للاتصال بواجهة برمجة تطبيقات السحابة
- تحميل ملف المستند الخاص بك
- تحليل مستندات PDF لاستخراج النصوص في التخزين السحابي باستخدام دالة getDocumentTextBoxFields
- فحص الاستجابة وتسجيل النتيجة
- إذا نجحت العملية، اطبع النصوص المستخرجة
يعرض هذا العينة من الكود تحليل مستند PDF لاستخراج النصوص
import java.io.File;
import java.nio.file.Files;
import java.nio.file.OpenOption;
import java.nio.file.StandardOpenOption;
import java.nio.file.Path;
import com.google.gson.Gson;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TextBoxField;
import com.aspose.asposecloudpdf.model.TextBoxFieldsResponse;
public class ParseGetTextBoxes {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String OUTPUT_FILE = "parsed_text_box_fields_output.json";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// perform action
TextBoxFieldsResponse response = pdfApi.getDocumentTextBoxFields(PDF_DOCUMENT, null, REMOTE_FOLDER);
System.out.println("TextBox fields extracted status: " + response.getStatus());
String jsonResult = "[\n";
for (TextBoxField fieldDef : response.getFields().getList()) {
String jsonFiled = new Gson().toJson(fieldDef);
jsonResult += jsonFiled + ",\n\n";
}
jsonResult +="]";
// save json
Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
byte[] strToBytes = jsonResult.getBytes();
Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
System.out.println("TextBox fields successfully extracted to: '" + path + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
العمل مع تحليل النص في PDF عبر مجموعة أدوات جافا
من خلال تحليل مستندات PDF لاستخراج النصوص، يمكنك تعديل محتوى حقول TextBox حسب الحاجة. هذا يحافظ على موضع النص في المستندات مع توفير الوقت وتقليل العمل اليدوي. قم بتحليل مستندات PDF لاستخراج النصوص باستخدام Aspose.PDF Cloud Java SDK.
مع مجموعة أدوات جافا الخاصة بنا يمكنك
- إضافة رأس وتذييل مستند PDF بنص أو صورة.
- إضافة جداول وختم نص أو صورة إلى مستندات PDF.
- إلحاق مستندات PDF متعددة إلى ملف موجود.
- التعامل مع مرفقات PDF، التعليقات التوضيحية، وحقول النماذج.
- تطبيق التشفير أو فك التشفير على مستندات PDF وتعيين كلمة مرور.
- حذف جميع الطوابع والجداول من صفحة أو مستند PDF كامل.
- حذف طابع أو جدول محدد من مستند PDF حسب المعرف الخاص به.
- استبدال نسخة واحدة أو متعددة من النص على صفحة PDF أو من المستند بالكامل.
- دعم شامل لتحويل مستندات PDF إلى صيغ ملفات أخرى متنوعة.
- استخراج عناصر متنوعة من ملفات PDF وجعل مستندات PDF محسّنة.
- يمكنك تجربة التطبيق المجاني لاختبار الوظيفة.
- موارد التعلم
- التوثيق
- الكود المصدر
- مراجع API
- لماذا Aspose.PDF Cloud للـ Java؟
- قائمة العملاء
- الأمان