كيفية استخدام Tesseract OCR في جافا

مؤلف: Eugene Taylor
تاريخ الخلق: 7 أغسطس 2021
تاريخ التحديث: 8 قد 2024
Anonim
How to use Tesseract OCR with Java? | Extract text from image
فيديو: How to use Tesseract OCR with Java? | Extract text from image

المحتوى

توفر مكتبات Tesseract للتعرف على الأحرف البصرية للمطورين طريقة لمسح المستندات والنصوص في صورة. يتم استخدامها لتخزين صور المستندات التي لم تعد بحاجة إليها على الورق. يمكنك استخدامها في Java عن طريق إنشاء حلقات تحكم لكل حرف وكتابة كل ملف. لاستخدام مكتبات Tesseract ، يجب عليك تضمين "مساحة اسم" Java لوظائف OCR.


الاتجاهات

تتيح مكتبات Tesseract للمستخدمين فحص مستنداتهم (جون فوكس / ستوكبيت / غيتي إيماجز)
  1. انقر بزر الماوس الأيمن فوق ملف Java الذي تريد استخدامه لإنشاء مستند OCR. انقر فوق "فتح باستخدام" وحدد محرر جافا من اختيارك.

  2. أضف مساحة اسم مكتبة OCR في الجزء العلوي من الملف. انسخ والصق الكود التالي في ملفك المصدر:

    com.tplan.robot.imagecomparison.tesseractocr

  3. قم بإنشاء الكود المسؤول عن مسح الأحرف لملف ما. على سبيل المثال ، تنشئ التعليمة البرمجية التالية حلقات عبر كل حرف في ملف وتكتبها إلى ملف صورة:

    (I = 1 ؛ {i} <{lines} +1 ؛ i = {i}) هي مجموعة من القيم التي يتم تعريفها على أنها: +1) {Typline "{_TOCR_LINE {i}}"}

  4. انقر فوق الزر "حفظ" الخاص بالمحرر وانقر فوق "تشغيل" لتشغيل الكود في برنامج التحويل البرمجي لـ Java.