كيفية استخدام Tesseract OCR في جافا

فيديو: How to use Tesseract OCR with Java? | Extract text from image

المحتوى

الاتجاهات

توفر مكتبات Tesseract للتعرف على الأحرف البصرية للمطورين طريقة لمسح المستندات والنصوص في صورة. يتم استخدامها لتخزين صور المستندات التي لم تعد بحاجة إليها على الورق. يمكنك استخدامها في Java عن طريق إنشاء حلقات تحكم لكل حرف وكتابة كل ملف. لاستخدام مكتبات Tesseract ، يجب عليك تضمين "مساحة اسم" Java لوظائف OCR.

الاتجاهات

تتيح مكتبات Tesseract للمستخدمين فحص مستنداتهم (جون فوكس / ستوكبيت / غيتي إيماجز)

انقر بزر الماوس الأيمن فوق ملف Java الذي تريد استخدامه لإنشاء مستند OCR. انقر فوق "فتح باستخدام" وحدد محرر جافا من اختيارك.
أضف مساحة اسم مكتبة OCR في الجزء العلوي من الملف. انسخ والصق الكود التالي في ملفك المصدر:

com.tplan.robot.imagecomparison.tesseractocr
قم بإنشاء الكود المسؤول عن مسح الأحرف لملف ما. على سبيل المثال ، تنشئ التعليمة البرمجية التالية حلقات عبر كل حرف في ملف وتكتبها إلى ملف صورة:

(I = 1 ؛ {i} <{lines} +1 ؛ i = {i}) هي مجموعة من القيم التي يتم تعريفها على أنها: +1) {Typline "{_TOCR_LINE {i}}"}
انقر فوق الزر "حفظ" الخاص بالمحرر وانقر فوق "تشغيل" لتشغيل الكود في برنامج التحويل البرمجي لـ Java.