• ওসিআর কি? জেনে নিন, কম্পিউটার কীভাবে আপনার হাতের লেখা চিনতে পারে?

    ওসিআর কি? জেনে নিন, কম্পিউটার কীভাবে আপনার হাতের লেখা চিনতে পারে?

    মনে করুন,আপনি পরীক্ষা হল’এ পরিক্ষা দিচ্ছেন। আপনার কিছুই কমন আসেনি। তাই পাশে বসা বন্ধুর লিখা দেখার চেষ্টা করছেন। কিন্তু,তার লিখা যে এতো বাজে, যার ফলে আপনি কিছুই বুঝতে পারছেন না!  অনেক সময় এমন হয় যে, অনেক দ্রুত লিখতে গিয়ে পরে নিজের হাতের লিখাই বুঝতে পারা যায় না। তখন মনে হয়, ইস! যদি হাতে না লিখে কম্পিউটারে টাইপ করে পরীক্ষা দেওয়া যেতো, তবে কত ভাল হতো!
    আসি, আসল কথাতে। কম্পিউটার আমাদের দেওয়া লিখিত কমান্ড গুলো কিভাবে সনাক্ত করে তা কি জানেন? এটি ঘটে ওসিআর নামক একটি সফট্‌ওয়ারের মাধ্যমে। চলুন এটি কি? এবং এর ব্যাপারে বিস্তারিত জেনে আসি।

    ওসিআর কি?

    ওসিআর হল অপটিক্যাল ক্যারেক্টার রেকগনেশন এর সংক্ষিপ্ত রূপ। এটিকে অপটিক্যাল ক্যারেক্টার রিডার্‌ও বলা হয়। এটা ব্যাপকভাবে প্রিন্টেড কাগজ ডেটা রেকর্ড থেকে তথ্য এন্ট্রি একটি ফর্ম হিসাবে ব্যবহৃত হয়, পাসপোর্ট ডকুমেন্টস, ইনভয়েস, ব্যাংক স্টেটমেন্ট, কম্পিউটারাইজড রসিদ, ব্যবসা কার্ড, মেইল, স্ট্যাটিক-ডেটা প্রিন্ট করা, বা কোন উপযুক্ত ডকুমেন্টেশন প্রভৃতির জন্য ব্যবহৃত হয়।
    প্রারম্ভিক পর্যায়ে এই প্রজুক্তিটি, টেলিগ্রাফ সম্পর্কিত প্রযুক্তিতে এবং অন্ধদের জন্য রিডিং ডিভাইস তৈরি করতে ব্যবহার করা হত। ১৯১৪ সালে, ইমানুয়েল গোল্ডবার্গ একটি মেশিন তৈরি করেন যা অক্ষরগুলি পড়ে এবং তাদের প্রমিত টেলিগ্রাফ কোড রূপান্তর করতে পারে।
    একযোগে, এডমুন্ড ফার্নিয়ার ডি আলবে, অপটফোন নামক একটি হ্যান্ডহেল্ড স্ক্যানার তৈরি করেন। যখন এটি একটি মুদ্রিত পৃষ্ঠা জুড়ে সরানো হয় তখন নির্দিষ্ট অক্ষর বা অক্ষরের সাথে সংযুক্ত টোনগুলি তৈরি করে।
    ১৯২০-এর দশকের শেষের দিকে এবং ১৯৩০-এর দশকে ইমানুয়েল গোল্ডবার্গ একটি অপটিক্যাল কোড স্বীকৃতি সিস্টেম ব্যবহার করে মাইক্রোফিল্ম আর্কাইভগুলি অনুসন্ধানের জন্য তৈরী করে এটিকে একটি “স্ট্যাটিস্টিকাল মেশিন” বলেছিলেন।

    স্মার্ট ফোনের এবং স্মার্টগ্লাসের আবির্ভাবের সাথে, ওসিআরটি ইন্টারনেট সংযুক্ত মোবাইল ডিভাইস অ্যাপ্লিকেশনগুলিতে ব্যবহার করা যেতো, যা ডিভাইসের ক্যামেরা ব্যবহার করে লিখিত অক্ষরগুলি এক্সট্রাক্ট করে। স্মার্ট ফোনের এবং স্মার্টগ্লাসের আবির্ভাবের সাথে, ওসিআরটি ইন্টারনেট সংযুক্ত মোবাইল ডিভাইস অ্যাপ্লিকেশনগুলিতে ব্যবহার করা যেতো, যা ডিভাইসের ক্যামেরা ব্যবহার করে লিখিত অক্ষরগুলি এক্সট্রাক্ট করে। এই ডিভাইসগুলির যে অপারেটিং সিস্টেমের মধ্যে নির্মিত ওসিআর কার্যকারিতা নেই, সাধারণত একটি OCR API ব্যবহার করে চিত্রটি এক্সট্রাক্ট করা এবং ডিভাইসের দ্বারা উপলব্ধ করা হয়।
    ২০০০-এর দশকে, একটি ক্লাউড কম্পিউটিং পরিবেশে, এবং একটি স্মার্টফোন এ বিদেশী ভাষার লক্ষণের বাস্তব-সময় অনুবাদের মতো মোবাইল অ্যাপ্লিকেশানে ওসিআরকে একটি পরিষেবা (ওয়েবওসিআর) হিসাবে অনলাইনে উন্মুক্ত করা হয়েছিল। ল্যাটিন, সিরিলিক, আরবি, হিব্রু, ইন্ডিিক, বাংলা, দেবনাগরী, তামিল, চীনা, জাপানীজ এবং কোরিয়ান অক্ষর সহ বেশিরভাগ সাধারণ লিখন পদ্ধতির জন্য বিভিন্ন বাণিজ্যিক এবং ওপেন সোর্স ওসিআর সিস্টেম উপলব্ধ রয়েছে।
    প্রকৃত অর্থে,সহজ ভাবে দেখলে, ও,সি,আর  একধরণের কম্পিউটার প্রোগ্রাম বা সফটওয়্যার, যা স্বয়ংক্রিয়ভাবে কোন প্রিন্ট করা টেক্সট বা হ্যান্ড রাইটিং বিশ্লেষণ করতে পারে এবং এটিকে এমন একটি রূপে নিয়ে যায়, যাতে কম্পিউটার তা সহজেই বুঝতে পারে। এমন কি, আপনার সেলফোনে যে হ্যান্ড রাইটিং কীবোর্ড রয়েছে, সেটিও ওসিআর সিস্টেম ব্যবহার করেই কাজ করে আসুন, এবার এর কাজ করার পদ্ধতি সম্পর্কে জেনে নেওয়া যাকঃ
    ওসিআর কীভাবে কাজ করে?
    ওসিআর কীভাবে কাজ করে?

    ওসিআর কীভাবে কাজ করে?

    ওসিআর একটি বিশেষ ধরনের প্রক্রিয়া যা আমাদের পাঠ্য ভিত্তিক চিত্রগুলিকে সম্পাদনাযোগ্য বৈদ্যুতিন নথিতে রূপান্তর করতে দেয়। এই চিত্রগুলি স্ক্যানার, ক্যামেরা, শুধুমাত্র ফাইলগুলি পড়তে ইত্যাদি দ্বারা উত্পাদিত হতে পারে। ও,সি,আর সফ্টওয়্যার একটি ইমেজ ফাইল কে সম্পাদনাযোগ্য ডকুমেন্টে রূপান্তর করার জন্য বিভিন্ন পদক্ষেপ নেয়। এই প্রক্রিয়ার প্রত্যেকটি পদক্ষেপ একটি ফাইলের মধ্যে পাওয়া চিত্রগুলিকে পরিবর্তন, বৃদ্ধি এবং ব্যাখ্যা করার জন্য একটি নির্দিষ্ট অ্যালগরিদম ব্যবহার করে।
    তবে মূলত,এর দুই’টি প্রধান পদ্ধতি রয়েছে কাজ করার জন্য। একটি হলো, প্রতিটি অক্ষরকে এদের সম্ভাব্য সকল প্যাটার্নে (প্যাটার্ন রেকগনেশন) চিনে রাখা এবং আরেকটি হলো প্রত্যেকটি অক্ষরের প্রত্যেকটি লাইন, প্রত্যেকটি সূক্ষ্ম রেখা (ফিচার ডিটেকশন) মনে রেখে ঐ অক্ষরকে চিনতে পারা।  নিম্নে এ সম্পর্কে অধিক আলোচনা করা হলো,

    প্যাটার্ন বা ক্যারেক্টার রেকগনেশন:

    ম্যাট্রিক্স মিলে যাওয়া একটি চিত্র তুলনা করে,একটি glyph এ পিক্সেল বাই পিক্সেল সংরক্ষন করার ভিত্তিতে। এটি ইনপুট গ্লিফের উপর ভিত্তি করে ছবির বাকি অংশ থেকে সঠিকভাবে বিচ্ছিন্ন করে এবং একই রকম সংরক্ষিত ফাঁকা থাকা অবস্থায় একই স্কেলে সংরক্ষন করে। এই কৌশল টাইপরাইটেড টেক্সটের সাথে ভাল কাজ করে এবং যখন নতুন ফন্টগুলি পাওয়া যায় তখন ভাল কাজ করে না। এই পদ্ধতিটি প্রাথমিকভাবে প্রাথমিক ফোকোটেল-ভিত্তিক OCR বাস্তবায়িত, বরং সরাসরি। এটি মূলত ও,সি,আর এর প্রাথমিক ফাংশন।
    ১৯৬০ সালের দিকে ব্ল্যাঙ্ক চেক লেখার জন্য এক স্পেশাল ফোন উন্নতিকরণ করা হয়েছিল, যার নাম “OCR-A”। তখন প্রত্যেকটি চেকে মূলত একই ধরনের ফন্ট ব্যবহার করা হতো, ফলে অপটিক্যাল ক্যারেক্টার রেকগনেশন বা ওসিআর সহজেই সেই ফন্ট বুঝতে পারতো।  কিন্তু, বর্তমানে বিভিন্ন কাজের জন্য বিভিন্ন ফন্ট ব্যবহার করা হয়। প্যাটার্ন রিকগনেশন সিস্টেম অনেক ক্ষেত্রে লেবেলযুক্ত “প্রশিক্ষণ” ডেটা থেকে প্রশিক্ষণপ্রাপ্ত হয়। কিন্তু যখন কোনো লেবেলযুক্ত তথ্য পাওয়া যায় না তখন অন্য অ্যালগরিদমগুলি পূর্বে অজানা নকশার (অনির্বাচিত শিক্ষণ) আবিষ্কার করতে ব্যবহার করা যায়। এই প্যাটার্ন রেকগনেশন সিস্টেম এর প্রধান কাজ হল, প্রত্যেকটি অক্ষরকে চেনার জন্য ওসিআর প্রোগ্রামকে বিশেষভাবে প্রশিক্ষণ দেওয়া, যাতে কোন অক্ষর চিনতে প্রোগ্রাম নাম্বার ব্যবহার করে। জনপ্রিয় ফন্ট গুলোর বিপরিতে প্রোগ্রাম একটি নাম্বারের সাড়ি মনে রাখে এবং স্ক্যান করার সময় সেই নাম্বার গুলো ডিকোড করে অক্ষরগুলো চেনার চেষ্টা করে। এই পদ্ধতিতে আপনার লেখা অক্ষর যে শতভাগ চিনতে পারা যাবে, এতে কোন নিশ্চয়তা নেই।  তবে বেশিরভাগ ক্ষেত্রেই এটি কাজ দেয়।

    ফিচার ডিটেকশন:

    ফিচার ডিটেকশনকে ইনটেলিজেন্ট ক্যারেক্টার রেকগনেশন বা আইসিআর ও বলা হয়ে থাকে। এটি কোন ক্যারেক্টারকে চেনার জন্য সবচাইতে ব্যস্তব বুদ্ধি সম্পন্ন পদ্ধতি। কম্পিউটারের দৃষ্টি ও চিত্র প্রক্রিয়াকরণে বৈশিষ্ট্য সনাক্তকরণের ধারণাগুলি এমন পদ্ধতিগুলিকে নির্দেশ করে যা ইমেজ তথ্যের অবমুক্তকরণ এবং প্রতিটি সিদ্ধান্তে স্থানীয় সিদ্ধান্তগুলি নির্ণয় করার জন্য লক্ষ্য রাখে যে কোনও নির্দিষ্ট চিত্রের একটি নির্দিষ্ট বৈশিষ্ট্য আছে কিনা। ফলে বৈশিষ্ট্য ইমেজ ডোমেনের উপসেট হবে, প্রায়ই বিচ্ছিন্ন পয়েন্ট, ক্রমাগত কার্ভ বা সংযুক্ত অঞ্চলগুলির আকারে।
    মনে করা যাক, একটি কম্পিউটারের সামনে অনেক গুলো ভিন্ন ভিন্ন ধরনের অক্ষর রেখে দেওয়া হল। যেখানে বিভিন্ন অক্ষর বিভিন্ন ফন্ট ব্যবহার করে লেখা। তবে, এই অক্ষর গুলো কম্পিউটার কিভাবে সনাক্ত করবে?  এ ক্ষেত্রে এই কাজ কে সহজ করার জন্য অভিনব উপায় রয়েছে।  যখন এটি দুইটি বাঁকানো লাইন দেখতে পাবে এবং দেখবে যে আরেকটি লাইন উপরের দিকে সেই দুইটি লাইনের সাথে সংযুক্ত হয়েছে, এবং বাঁকানো লাইন দুটি হেলিয়ে খাঁড়াভাবে রয়েছে এবং আরেকটি লাইন সমতলভাবে উপরের দিকে বা মাঝখানে এসে একত্রিত হয়েছে, তখন এটি সহজেই বুঝে নিতে পারবে যে এই অক্ষরটি হলো “A”। অথবা, দু’টি একটি খাঁড়া লাইন এর সাথে দু’টি গোল বৃত্ত রয়েছে, তখন এটি বুঝে নিতে পারবে যে এটি “B”.
    তবে উল্লেখ্য, এই পদ্ধতি ব্যবহার করে সাধারনত বেশিরভাগই বড় হাতের অক্ষর চিনতে পারা যায়, এতে কোন যায় আসেনা যে অক্ষরটি কোন ফন্ট ব্যবহার করে লেখা রয়েছে। সরাসরি কোন অক্ষরের সম্পূর্ণ প্যাটার্ন মনে না রেখে সেই অক্ষটির প্রত্যেকটি লাইন প্রত্যেকটি সূক্ষ্ম রেখা এবং তাদের অবস্থানের ধারণা রাখলেই খুব সহজে কোন অক্ষর চিনতে পারা সম্ভব। বেশিরভাগ আধুনিক ওসিআর প্রোগ্রাম প্যাটার্ন রেকগনেশন পদ্ধতির চাইতে ফিচার ডিটেকশন পদ্ধতিই বেশি ব্যবহার করে। কিছু প্রোগ্রাম নিউরাল নেটওয়ার্ক ব্যবহার করে কাজ করে। নিউরাল নেট্‌ওয়ার্ক হল এমন পদ্ধতি, যেখানে কম্পিউটার প্রোগ্রাম স্বয়ংক্রিয়ভাবে মানুষের মস্তিকের মতো কাজ করতে পারে।
    হ্যান্ড রাইটিং রিকগনিশন কিভাবে কাজ করে?
    হ্যান্ড রাইটিং রিকগনিশন কিভাবে কাজ করে?

    হ্যান্ড রাইটিং রিকগনিশন কিভাবে কাজ করে?

    হ্যান্ড রাইটিং রিকগনিশন হল, একটি কম্পিউটারের ক্ষমতা যা কাগজের নথি, ফটোগুলি, স্পর্শ-স্ক্রিন এবং অন্যান্য ডিভাইসগুলি থেকে সূত্র থেকে বোধগম্য হস্তাক্ষরিত ইনপুট বোঝায়। লিখিত টেক্সটের ইমেজ অপটিক্যাল স্ক্যানিং (অপটিক্যাল ক্যারেক্টার রিকগনিশন ) বা বুদ্ধিমান শব্দ স্বীকৃতি দ্বারা কাগজের একটি টুকরা থেকে “অফ লাইন” অনুভূত হতে পারে।
    হ্যান্ড রাইটিং রিকগনিশন মূলত ও,সি,আর এর অনিবার্য ফল. যাইহোক, একটি সম্পূর্ণ হস্তাক্ষর স্বীকৃতি সিস্টেম বিন্যাসন হ্যান্ডলগুলি, অক্ষর মধ্যে সঠিক সেগমেন্টেশন সঞ্চালিত এবং সবচেয়ে যুক্তিসঙ্গত শব্দ খুঁজে বের করে।

    আমরা যখন ট্যাবলেট কম্পিউটার বা স্মার্টফোনের হ্যান্ড রাইটিং কীবোর্ড দিয়ে কিছু লিখি, সেটা কম্পিউটারের কাছে সনাক্ত করা অনেক সহজ হয়ে থাকে। যেমন ধরুন, আপনি একটা খাঁড়া দাগ টানলেন,তারপর সেই দাগের মাথায় আড়া-আড়ি ভাবে আরেকটা দাগ টানলেন। এতে ডিভাইস টি সহজেই বুঝে নিতে পারবে যে, এটা “T”. এখানে কম্পিউটার সমজেই বুঝতে পারে কোন রেখা কীভাবে আঁকা হয়েছিলো এবং আঁকার পরে এটিকে “T” অক্ষরে প্রকাশিত করে। কম্পিউটার এক্ষেত্রে ফিচার ডিটেকশন পদ্ধতি ব্যবহার করে। কিন্তু কোন কাগজের উপরে কোন এব্রোথেব্রো হাতের লেখা চিনতে পারা এতো সহজ কাজ হয়ে ওঠেনা। কোন হাতের লেখা কম্পিউটারকে চিনতে পাড়ার জন্য এক নির্দিষ্ট নিয়ম মেনে তবেই লিখতে হয়, আর এই লেখার নিয়মকে কম্ব ফিল্ডস বলা হয়। সেটা কম্পিউটারের জন্য যথেষ্ট কষ্টসাধ্য হয়।

    পরিশিষ্ট: 

    ও,সি,আর ১৯২০ এর দশক থেকে ব্যবহৃত হতে হতে আজকের এই অবস্থানে পৌছেছে। এবং চাহিদার উপর নির্ভর করে ভবিৎষ্যতে এটি আর্‌ও উন্নত হবে বলে ধারনা করা যায়।
    যায়হোক, আশা করি আজকের আর্টিক্যাল থেকে ভাল কিছু শিখতে পেরেছেন। পরবর্তিতে আমরা আবার্‌ও ভাল কোন আর্টিক্যাল নিয়ে হাজির হবো। ভাল থাকুন ততক্ষন। ধন্যবাদ।


  • 0 comments:

    Post a Comment

    New Research

    Attention Mechanism Based Multi Feature Fusion Forest for Hyperspectral Image Classification.

    CBS-GAN: A Band Selection Based Generative Adversarial Net for Hyperspectral Sample Generation.

    Multi-feature Fusion based Deep Forest for Hyperspectral Image Classification.

    ADDRESS

    388 Lumo Rd, Hongshan, Wuhan, Hubei, China

    EMAIL

    contact-m.zamanb@yahoo.com
    mostofa.zaman@cug.edu.cn

    TELEPHONE

    #
    #

    MOBILE

    +8615527370302,
    +8807171546477