كيفية استخراج النص من PDF عبر Node.js SDK
لاستخراج النص من PDF، سنستخدم Aspose.PDF Cloud Node.js SDK. هذا ال SDK السحابي يساعد مبرمجي Node.js في تطوير تطبيقات إنشاء، تعليق، تحرير وتحويل PDF قائمة على السحابة باستخدام لغة البرمجة Node.js عبر Aspose.PDF REST API. ببساطة قم بإنشاء حساب في Aspose for Cloud واحصل على معلومات تطبيقك. بمجرد حصولك على App SID والمفتاح، ستكون جاهزًا لاستخدام Aspose.PDF Cloud Node.js SDK.
أمر وحدة التحكم في إدارة الحزم
npm install asposepdfcloud --save
خطوات استخراج النص باستخدام Node.js
يمكن لمطوري Aspose.PDF Cloud تحميل واستخراج النص من PDF بسهولة في بضع سطور من الكود.
- قم بتحميل السر والمفتاح لتطبيقك من ملف JSON أو تعيين بيانات الاعتماد بطريقة أخرى
- أنشئ كائنًا للاتصال بواجهة برمجة التطبيقات السحابية
- قم بتحميل ملف مستندك
- قم بتنفيذ استخراج النص باستخدام وظيفة pdfApi.getText
- قم بتنزيل النتيجة إذا لزم الأمر
استخراج النص من PDF باستخدام Node.js
async function () {
const pdfApi = new PdfApi(credentials.id, credentials.key);
try {
const fileBuffer = await fs.readFile(LOCAL_FILE_NAME);
await pdfApi.uploadFile(STORAGE_FILENAME, fileBuffer);
const result = await pdfApi.getText(STORAGE_FILENAME, 0, 0, 0, 0);
const lines = result.body.textOccurrences.list.map(line=>line.text).join("\n");
await fs.writeFile("extracted.txt", lines);
}
catch (error) {
console.error(error.message);
}
}
العمل مع النص في PDF
يسمح استخراج النص بتحليل البيانات داخل ملفات PDF أو تنظيمها أو معالجتها في تطبيقات خارجية. يمكن فهرسة النص المستخرج، مما يجعله قابلاً للبحث عبر قواعد البيانات أو أنظمة إدارة المحتوى. هذا يحسن استرجاع المستندات ويسمح بالوصول الأسرع إلى المعلومات المحددة، خاصة في أرشيفات المستندات الكبيرة. من خلال استخراج النص وحفظه بتنسيق أبسط (مثل النص العادي أو XML)، يمكن للمستخدمين تقليل حجم الملفات، مما يجعلها أسهل في المشاركة أو التوزيع. استخرج النص من مستندات PDF باستخدام Aspose.PDF Cloud Node.js SDK.
مع مكتبة Node.js الخاصة بنا يمكنك:
- إضافة رأس وتذييل مستند PDF بتنسيق نص أو صورة.
- إضافة جداول وأختام (نص أو صورة) إلى مستندات PDF.
- إلحاق مستندات PDF متعددة إلى ملف موجود.
- العمل مع مرفقات PDF والتعليقات التوضيحية وحقول النماذج.
- تطبيق التشفير أو فك التشفير على مستندات PDF وتعيين كلمة مرور.
- حذف جميع الأختام والجداول من صفحة أو مستند PDF بالكامل.
- حذف ختم أو جدول محدد من مستند PDF باستخدام معرفه.
- استبدال مثيل واحد أو متعدد من النص في صفحة PDF أو من المستند بالكامل.
- دعم واسع لتحويل مستندات PDF إلى تنسيقات ملفات أخرى مختلفة.
- استخراج عناصر مختلفة من ملفات PDF وجعل مستندات PDF محسنة.
- يمكنك تجربة تطبيقنا المجاني لاستخراج النص من ملفات PDF عبر الإنترنت واختبار الوظيفة.
- موارد التعلم
- التوثيق
- كود المصدر
- مراجع API
- دعم المنتج
- الدعم المجاني
- الدعم المدفوع
- مدونة
- لماذا Aspose.PDF Cloud لـ Node.js؟
- قائمة العملاء
- الأمان