• What is Computer Vision An Introduction

    কম্পিউটার দৃষ্টি একটি অন্তর্বর্তী বৈজ্ঞানিক ক্ষেত্র যা ডিজিটাল চিত্রগুলি বা ভিডিওগুলি থেকে উচ্চ-স্তরের বোঝার জন্য কম্পিউটারগুলি কীভাবে তৈরি করা যায় তার সাথে সম্পর্কিত। প্রকৌশল দৃষ্টিকোণ থেকে, এটি মানব চাক্ষুষ সিস্টেম করতে পারেন যে কাজ স্বয়ংক্রিয় করতে চায়

    what computer vision consist of :
    কৃত্রিম বুদ্ধিমত্তা ক্ষেত্রগুলি স্বায়ত্বশাসিত পরিকল্পনা বা রোবোটিক্যাল সিস্টেমের জন্য বিতর্কের মাধ্যমে পরিবেশের মাধ্যমে নেভিগেট করতে পারে। তাদের মাধ্যমে নেভিগেট করার জন্য এই পরিবেশগুলির একটি বিস্তারিত বোঝার প্রয়োজন। পরিবেশ সম্পর্কে তথ্য কম্পিউটার দৃষ্টি সিস্টেম দ্বারা সরবরাহ করা যেতে পারে, দৃষ্টি সেন্সর হিসাবে কাজ করা এবং পরিবেশ এবং রোবট সম্পর্কে উচ্চ স্তরের তথ্য সরবরাহ করা।

    কৃত্রিম বুদ্ধিমত্তা এবং কম্পিউটার দৃষ্টি যেমন প্যাটার্ন স্বীকৃতি এবং শেখার কৌশল অন্যান্য বিষয় শেয়ার করুন। ফলস্বরূপ, কম্পিউটার দৃষ্টি কখনও কখনও কৃত্রিম বুদ্ধিমত্তা ক্ষেত্র বা কম্পিউটার বিজ্ঞান ক্ষেত্রের অংশ হিসাবে দেখা হয়।

    Information engineering
    কম্পিউটার দৃষ্টি প্রায়ই তথ্য প্রকৌশল অংশ বলে মনে করা হয়।

    নিউরোবায়োলজিNeurobiology
    একটি তৃতীয় ভূমিকা যা একটি গুরুত্বপূর্ণ ভূমিকা পালন করে neurobiology, বিশেষত জৈব দৃষ্টি সিস্টেম গবেষণা। গত শতাব্দীতে, মানুষের এবং বিভিন্ন প্রাণী উভয় ক্ষেত্রে চাক্ষুষ উদ্দীপনার প্রক্রিয়াকরণের জন্য নিবেদিত চোখ, নিউরন এবং মস্তিষ্কের কাঠামোর ব্যাপক গবেষণা হয়েছে। এর ফলে কিছু দৃষ্টি-সম্পর্কিত কাজগুলি সমাধান করার জন্য "বাস্তব" দৃষ্টি সিস্টেমগুলি কীভাবে পরিচালিত হয় তার বিবরণটি একটি মোটা, জটিল হলেও বর্ণনা করে। এই ফলাফল কম্পিউটার দৃষ্টিভঙ্গির মধ্যে একটি সাবফিল্ডের দিকে পরিচালিত করেছে যেখানে কৃত্রিম সিস্টেমগুলি জটিলতার বিভিন্ন স্তরে জৈবিক ব্যবস্থার প্রক্রিয়াকরণ এবং আচরণের অনুকরণ করার জন্য ডিজাইন করা হয়েছে। এছাড়াও, কম্পিউটার দৃষ্টিভঙ্গির মধ্যে উন্নত কিছু শেখার ভিত্তিক পদ্ধতিগুলি (উদাহরণস্বরূপ e.g.neural net and deep learning  ভিত্তিক চিত্র এবং বৈশিষ্ট্য বিশ্লেষণ এবং শ্রেণীবিভাগ) জীববিজ্ঞানে তাদের পটভূমি রয়েছে।

    Signal processing
    তবুও কম্পিউটার দৃষ্টি সম্পর্কিত আরেকটি ক্ষেত্র signal processing। এক ভেরিয়েবল সিগন্যালগুলির প্রক্রিয়া করার জন্য অনেক পদ্ধতি, সাধারণত সাময়িক সংকেত, কম্পিউটার দৃষ্টিভঙ্গিতে দুইটি পরিবর্তনশীল সংকেত বা মাল্টি-পরিবর্তনশীল সংকেতগুলির প্রক্রিয়াকরণের প্রাকৃতিক পদ্ধতিতে প্রসারিত করা যেতে পারে। যাইহোক, চিত্রের নির্দিষ্ট প্রকৃতির কারণে কম্পিউটার দৃষ্টিভঙ্গির মধ্যে অনেকগুলি পদ্ধতি রয়েছে যা একটি পরিবর্তনশীল সিগন্যালগুলির প্রক্রিয়াকরণে কোন সদৃশ নেই। সিগন্যালের বহু-মাত্রিকতার সাথে, এটি কম্পিউটার দৃষ্টিভঙ্গির অংশ হিসাবে সংকেত প্রক্রিয়াকরণে একটি উপক্ষেত্রকে সংজ্ঞায়িত করে।

    কম্পিউটার দৃষ্টি, ইমেজ প্রসেসিং, এবং  machine vision ক্লাসিক্যাল সমস্যাটি হল চিত্রের ডেটা নির্দিষ্ট কিছু, বৈশিষ্ট্য, বা কার্যকলাপ রয়েছে কিনা তা নির্ণয় করা হয়। স্বীকৃতি সমস্যার বিভিন্ন ধরণের সাহিত্যে বর্ণনা করা হয়েছে: [উদ্ধৃতি প্রয়োজন]

    অবজেক্ট স্বীকৃতি (বস্তু শ্রেণীবদ্ধকরণও বলা হয়) - এক বা একাধিক পূর্বনির্ধারিত বা শিখানো বস্তু বা বস্তু ক্লাস সনাক্ত করা যেতে পারে, সাধারণত ছবিতে তাদের 2 ডি অবস্থানের সাথে বা 3D দৃশ্যটিতে ভঙ্গ করে। ব্লিপ্পার, গুগল গগলস এবং লাইকট্যাট এই কার্যকারিতাটিকে চিত্রিত করে এমন একচেটিয়া প্রোগ্রাম সরবরাহ করে।

    Identification 
    সনাক্তকরণ - একটি বস্তুর একটি পৃথক উদাহরণ স্বীকৃত হয়। উদাহরণগুলির মধ্যে একটি নির্দিষ্ট ব্যক্তির মুখ বা আঙ্গুলের ছাপ সনাক্তকরণ, হস্তলিখিত সংখ্যা সনাক্তকরণ, বা একটি নির্দিষ্ট গাড়ির সনাক্তকরণ অন্তর্ভুক্ত।

    সনাক্তকরণ - ইমেজ তথ্য একটি নির্দিষ্ট অবস্থার জন্য স্ক্যান করা হয়। উদাহরণগুলিতে চিকিৎসা চিত্রগুলিতে সম্ভাব্য অস্বাভাবিক কোষ বা টিস্যু সনাক্তকরণ বা একটি স্বয়ংক্রিয় রাস্তা টোল সিস্টেমের মধ্যে একটি গাড়ির সনাক্তকরণ অন্তর্ভুক্ত। অপেক্ষাকৃত সহজ এবং দ্রুত গণনাগুলির উপর ভিত্তি করে সনাক্তকরণটি কখনও কখনও আকর্ষণীয় ইমেজ ডেটার ছোট অঞ্চলের সন্ধানের জন্য ব্যবহৃত হয় যা আরও সঠিকভাবে ব্যাখ্যা করার জন্য আরও বেশি কম্পিউটেশালিভাবে দাবি করার কৌশলগুলি দ্বারা বিশ্লেষণ করা যেতে পারে।

    বর্তমানে, এই ধরনের কাজগুলির জন্য সেরা অ্যালগরিদমগুলি সংশ্লেষিক স্নায়ুতন্ত্রের উপর ভিত্তি করে। তাদের ক্ষমতাগুলির একটি চিত্র চিত্র চিত্র বৃহৎ স্কেল ভিজ্যুয়াল রেকগনিশন চ্যালেঞ্জ দ্বারা দেওয়া হয়; এটি বস্তু শ্রেণীবদ্ধকরণ এবং সনাক্তকরণের একটি বেঞ্চমার্ক, লক্ষ লক্ষ চিত্র এবং শত শত অবজেক্ট ক্লাসের সাথে। ImageNet পরীক্ষাগুলিতে কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলির পারফরম্যান্স এখন মানুষের কাছে ঘনিষ্ঠ। [26] সেরা অ্যালগরিদম এখনও ছোট বা পাতলা বস্তুর সাথে লড়াই করে, যেমন একটি ফুলের ডালপালা বা তাদের হাতে একটি কুইল থাকা ব্যক্তি। তারা ফিল্টারগুলির সাথে বিকৃত হয়েছে এমন চিত্রগুলির সাথেও সমস্যা রয়েছে (আধুনিক ডিজিটাল ক্যামেরাগুলির সাথে ক্রমবর্ধমান সাধারণ ঘটনা)। বিপরীতে, এই ধরনের চিত্রগুলি খুব কমই মানুষের সমস্যার সৃষ্টি করে। মানুষ, তবে, অন্যান্য বিষয় সঙ্গে সমস্যা আছে ঝোঁক। উদাহরণস্বরূপ, তারা সূক্ষ্ম কুকুরের শ্রেণিতে যেমন কুকুরের নির্দিষ্ট জাত বা প্রজাতির প্রজাতিগুলিতে শ্রেণিবদ্ধ শ্রেণিতে শ্রেণীবদ্ধ নয়, তেমনি কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলি সহজেই এটি পরিচালনা করে।

    Several specialized tasks based on recognition exist, such as:স্বীকৃতি উপর ভিত্তি করে বিভিন্ন বিশেষ কাজ বিদ্যমান, যেমন:
    Content-based image retrieval –সামগ্রী-ভিত্তিক চিত্র পুনরুদ্ধার - একটি নির্দিষ্ট সামগ্রীর চিত্রগুলির একটি বড় সেটের সমস্ত চিত্র খুঁজে বের করা। বিষয়বস্তুটি বিভিন্ন উপায়ে নির্দিষ্ট করা যেতে পারে, উদাহরণস্বরূপ মিলটির অনুরূপ একটি লক্ষ্য চিত্র (ইমেজ এক্স এর মতো সব ছবি আমাকে দিন), বা পাঠ্য ইনপুট হিসাবে দেওয়া উচ্চ-স্তরের অনুসন্ধানের মানদণ্ডের পরিপ্রেক্ষিতে (আমাকে সব ছবিগুলি অন্তর্ভুক্ত করুন অনেক ঘর, শীতকালে সময় নেওয়া হয়, এবং তাদের কোন গাড়ী আছে)।

    Computer vision for people counterpurposes in public places, malls, shopping centres
    1. Pose estimationআনুমানিক মূল্যায়ন - ক্যামেরা সম্পর্কিত একটি নির্দিষ্ট বস্তুর অবস্থান বা অভিযোজন অনুমান করা। এই পদ্ধতির জন্য একটি উদাহরণ অ্যাপ্লিকেশন একটি সমাবেশ লাইন পরিস্থিতি বা একটি বিন থেকে অংশ বাছাই একটি কনভেয়র বেল্ট থেকে বস্তু পুনরুদ্ধার করতে একটি রোবট আর্ম সাহায্য করবে।

    1. Optical character recognition (OCR)অপটিক্যাল ক্যারেক্টার স্বীকৃতি (ওসিআর) - মুদ্রিত বা হস্তাক্ষরযুক্ত charactersচিত্রগুলির চিত্রগুলিতে অক্ষর চিহ্নিত করা, সাধারণত editing or indexing (e.g. ASCII).সম্পাদনা বা সূচী (উদাঃ ASCII) এ আরও কার্যকর করার জন্য ফরম্যাটে পাঠ্য এনকোড করার দৃশ্যের সাথে

    1. 2D code reading – reading of 2D codes such as data matrix and QR codes

































  • 0 comments:

    Post a Comment

    New Research

    Attention Mechanism Based Multi Feature Fusion Forest for Hyperspectral Image Classification.

    CBS-GAN: A Band Selection Based Generative Adversarial Net for Hyperspectral Sample Generation.

    Multi-feature Fusion based Deep Forest for Hyperspectral Image Classification.

    ADDRESS

    388 Lumo Rd, Hongshan, Wuhan, Hubei, China

    EMAIL

    contact-m.zamanb@yahoo.com
    mostofa.zaman@cug.edu.cn

    TELEPHONE

    #
    #

    MOBILE

    +8615527370302,
    +8807171546477