What is Computer Vision An Introduction

কম্পিউটার দৃষ্টি ভূমিকা কি?

কম্পিউটার দৃষ্টি একটি অন্তর্বর্তী বৈজ্ঞানিক ক্ষেত্র যা ডিজিটাল চিত্রগুলি বা ভিডিওগুলি থেকে উচ্চ-স্তরের বোঝার জন্য কম্পিউটারগুলি কীভাবে তৈরি করা যায় তার সাথে সম্পর্কিত। প্রকৌশল দৃষ্টিকোণ থেকে, এটি মানব চাক্ষুষ সিস্টেম করতে পারেন যে কাজ স্বয়ংক্রিয় করতে চায়

what computer vision consist of :

কৃত্রিম বুদ্ধিমত্তা ক্ষেত্রগুলি স্বায়ত্বশাসিত পরিকল্পনা বা রোবোটিক্যাল সিস্টেমের জন্য বিতর্কের মাধ্যমে পরিবেশের মাধ্যমে নেভিগেট করতে পারে। তাদের মাধ্যমে নেভিগেট করার জন্য এই পরিবেশগুলির একটি বিস্তারিত বোঝার প্রয়োজন। পরিবেশ সম্পর্কে তথ্য কম্পিউটার দৃষ্টি সিস্টেম দ্বারা সরবরাহ করা যেতে পারে, দৃষ্টি সেন্সর হিসাবে কাজ করা এবং পরিবেশ এবং রোবট সম্পর্কে উচ্চ স্তরের তথ্য সরবরাহ করা।

কৃত্রিম বুদ্ধিমত্তা এবং কম্পিউটার দৃষ্টি যেমন প্যাটার্ন স্বীকৃতি এবং শেখার কৌশল অন্যান্য বিষয় শেয়ার করুন। ফলস্বরূপ, কম্পিউটার দৃষ্টি কখনও কখনও কৃত্রিম বুদ্ধিমত্তা ক্ষেত্র বা কম্পিউটার বিজ্ঞান ক্ষেত্রের অংশ হিসাবে দেখা হয়।

Information engineering

কম্পিউটার দৃষ্টি প্রায়ই তথ্য প্রকৌশল অংশ বলে মনে করা হয়।

নিউরোবায়োলজিNeurobiology

একটি তৃতীয় ভূমিকা যা একটি গুরুত্বপূর্ণ ভূমিকা পালন করে neurobiology, বিশেষত জৈব দৃষ্টি সিস্টেম গবেষণা। গত শতাব্দীতে, মানুষের এবং বিভিন্ন প্রাণী উভয় ক্ষেত্রে চাক্ষুষ উদ্দীপনার প্রক্রিয়াকরণের জন্য নিবেদিত চোখ, নিউরন এবং মস্তিষ্কের কাঠামোর ব্যাপক গবেষণা হয়েছে। এর ফলে কিছু দৃষ্টি-সম্পর্কিত কাজগুলি সমাধান করার জন্য "বাস্তব" দৃষ্টি সিস্টেমগুলি কীভাবে পরিচালিত হয় তার বিবরণটি একটি মোটা, জটিল হলেও বর্ণনা করে। এই ফলাফল কম্পিউটার দৃষ্টিভঙ্গির মধ্যে একটি সাবফিল্ডের দিকে পরিচালিত করেছে যেখানে কৃত্রিম সিস্টেমগুলি জটিলতার বিভিন্ন স্তরে জৈবিক ব্যবস্থার প্রক্রিয়াকরণ এবং আচরণের অনুকরণ করার জন্য ডিজাইন করা হয়েছে। এছাড়াও, কম্পিউটার দৃষ্টিভঙ্গির মধ্যে উন্নত কিছু শেখার ভিত্তিক পদ্ধতিগুলি (উদাহরণস্বরূপ e.g.neural net and deep learning ভিত্তিক চিত্র এবং বৈশিষ্ট্য বিশ্লেষণ এবং শ্রেণীবিভাগ) জীববিজ্ঞানে তাদের পটভূমি রয়েছে।

Signal processing

তবুও কম্পিউটার দৃষ্টি সম্পর্কিত আরেকটি ক্ষেত্র signal processing। এক ভেরিয়েবল সিগন্যালগুলির প্রক্রিয়া করার জন্য অনেক পদ্ধতি, সাধারণত সাময়িক সংকেত, কম্পিউটার দৃষ্টিভঙ্গিতে দুইটি পরিবর্তনশীল সংকেত বা মাল্টি-পরিবর্তনশীল সংকেতগুলির প্রক্রিয়াকরণের প্রাকৃতিক পদ্ধতিতে প্রসারিত করা যেতে পারে। যাইহোক, চিত্রের নির্দিষ্ট প্রকৃতির কারণে কম্পিউটার দৃষ্টিভঙ্গির মধ্যে অনেকগুলি পদ্ধতি রয়েছে যা একটি পরিবর্তনশীল সিগন্যালগুলির প্রক্রিয়াকরণে কোন সদৃশ নেই। সিগন্যালের বহু-মাত্রিকতার সাথে, এটি কম্পিউটার দৃষ্টিভঙ্গির অংশ হিসাবে সংকেত প্রক্রিয়াকরণে একটি উপক্ষেত্রকে সংজ্ঞায়িত করে।

কম্পিউটার দৃষ্টি, ইমেজ প্রসেসিং, এবং machine vision ক্লাসিক্যাল সমস্যাটি হল চিত্রের ডেটা নির্দিষ্ট কিছু, বৈশিষ্ট্য, বা কার্যকলাপ রয়েছে কিনা তা নির্ণয় করা হয়। স্বীকৃতি সমস্যার বিভিন্ন ধরণের সাহিত্যে বর্ণনা করা হয়েছে: [উদ্ধৃতি প্রয়োজন]

Object recognition

অবজেক্ট স্বীকৃতি (বস্তু শ্রেণীবদ্ধকরণও বলা হয়) - এক বা একাধিক পূর্বনির্ধারিত বা শিখানো বস্তু বা বস্তু ক্লাস সনাক্ত করা যেতে পারে, সাধারণত ছবিতে তাদের 2 ডি অবস্থানের সাথে বা 3D দৃশ্যটিতে ভঙ্গ করে। ব্লিপ্পার, গুগল গগলস এবং লাইকট্যাট এই কার্যকারিতাটিকে চিত্রিত করে এমন একচেটিয়া প্রোগ্রাম সরবরাহ করে।

Identification

সনাক্তকরণ - একটি বস্তুর একটি পৃথক উদাহরণ স্বীকৃত হয়। উদাহরণগুলির মধ্যে একটি নির্দিষ্ট ব্যক্তির মুখ বা আঙ্গুলের ছাপ সনাক্তকরণ, হস্তলিখিত সংখ্যা সনাক্তকরণ, বা একটি নির্দিষ্ট গাড়ির সনাক্তকরণ অন্তর্ভুক্ত।

Detection

সনাক্তকরণ - ইমেজ তথ্য একটি নির্দিষ্ট অবস্থার জন্য স্ক্যান করা হয়। উদাহরণগুলিতে চিকিৎসা চিত্রগুলিতে সম্ভাব্য অস্বাভাবিক কোষ বা টিস্যু সনাক্তকরণ বা একটি স্বয়ংক্রিয় রাস্তা টোল সিস্টেমের মধ্যে একটি গাড়ির সনাক্তকরণ অন্তর্ভুক্ত। অপেক্ষাকৃত সহজ এবং দ্রুত গণনাগুলির উপর ভিত্তি করে সনাক্তকরণটি কখনও কখনও আকর্ষণীয় ইমেজ ডেটার ছোট অঞ্চলের সন্ধানের জন্য ব্যবহৃত হয় যা আরও সঠিকভাবে ব্যাখ্যা করার জন্য আরও বেশি কম্পিউটেশালিভাবে দাবি করার কৌশলগুলি দ্বারা বিশ্লেষণ করা যেতে পারে।

বর্তমানে, এই ধরনের কাজগুলির জন্য সেরা অ্যালগরিদমগুলি সংশ্লেষিক স্নায়ুতন্ত্রের উপর ভিত্তি করে। তাদের ক্ষমতাগুলির একটি চিত্র চিত্র চিত্র বৃহৎ স্কেল ভিজ্যুয়াল রেকগনিশন চ্যালেঞ্জ দ্বারা দেওয়া হয়; এটি বস্তু শ্রেণীবদ্ধকরণ এবং সনাক্তকরণের একটি বেঞ্চমার্ক, লক্ষ লক্ষ চিত্র এবং শত শত অবজেক্ট ক্লাসের সাথে। ImageNet পরীক্ষাগুলিতে কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলির পারফরম্যান্স এখন মানুষের কাছে ঘনিষ্ঠ। [26] সেরা অ্যালগরিদম এখনও ছোট বা পাতলা বস্তুর সাথে লড়াই করে, যেমন একটি ফুলের ডালপালা বা তাদের হাতে একটি কুইল থাকা ব্যক্তি। তারা ফিল্টারগুলির সাথে বিকৃত হয়েছে এমন চিত্রগুলির সাথেও সমস্যা রয়েছে (আধুনিক ডিজিটাল ক্যামেরাগুলির সাথে ক্রমবর্ধমান সাধারণ ঘটনা)। বিপরীতে, এই ধরনের চিত্রগুলি খুব কমই মানুষের সমস্যার সৃষ্টি করে। মানুষ, তবে, অন্যান্য বিষয় সঙ্গে সমস্যা আছে ঝোঁক। উদাহরণস্বরূপ, তারা সূক্ষ্ম কুকুরের শ্রেণিতে যেমন কুকুরের নির্দিষ্ট জাত বা প্রজাতির প্রজাতিগুলিতে শ্রেণিবদ্ধ শ্রেণিতে শ্রেণীবদ্ধ নয়, তেমনি কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলি সহজেই এটি পরিচালনা করে।

Several specialized tasks based on recognition exist, such as:স্বীকৃতি উপর ভিত্তি করে বিভিন্ন বিশেষ কাজ বিদ্যমান, যেমন:

Content-based image retrieval –সামগ্রী-ভিত্তিক চিত্র পুনরুদ্ধার - একটি নির্দিষ্ট সামগ্রীর চিত্রগুলির একটি বড় সেটের সমস্ত চিত্র খুঁজে বের করা। বিষয়বস্তুটি বিভিন্ন উপায়ে নির্দিষ্ট করা যেতে পারে, উদাহরণস্বরূপ মিলটির অনুরূপ একটি লক্ষ্য চিত্র (ইমেজ এক্স এর মতো সব ছবি আমাকে দিন), বা পাঠ্য ইনপুট হিসাবে দেওয়া উচ্চ-স্তরের অনুসন্ধানের মানদণ্ডের পরিপ্রেক্ষিতে (আমাকে সব ছবিগুলি অন্তর্ভুক্ত করুন অনেক ঘর, শীতকালে সময় নেওয়া হয়, এবং তাদের কোন গাড়ী আছে)।

Computer vision for people counterpurposes in public places, malls, shopping centres

Pose estimationআনুমানিক মূল্যায়ন - ক্যামেরা সম্পর্কিত একটি নির্দিষ্ট বস্তুর অবস্থান বা অভিযোজন অনুমান করা। এই পদ্ধতির জন্য একটি উদাহরণ অ্যাপ্লিকেশন একটি সমাবেশ লাইন পরিস্থিতি বা একটি বিন থেকে অংশ বাছাই একটি কনভেয়র বেল্ট থেকে বস্তু পুনরুদ্ধার করতে একটি রোবট আর্ম সাহায্য করবে।

Optical character recognition (OCR)অপটিক্যাল ক্যারেক্টার স্বীকৃতি (ওসিআর) - মুদ্রিত বা হস্তাক্ষরযুক্ত charactersচিত্রগুলির চিত্রগুলিতে অক্ষর চিহ্নিত করা, সাধারণত editing or indexing (e.g. ASCII).সম্পাদনা বা সূচী (উদাঃ ASCII) এ আরও কার্যকর করার জন্য ফরম্যাটে পাঠ্য এনকোড করার দৃশ্যের সাথে

2D code reading – reading of 2D codes such as data matrix and QR codes

Facial recognition

Shape Recognition Technology (SRT) in people counter systems differentiating human beings (head and shoulder patterns) from objects

Mohammad Mostofa Zaman

What is Computer Vision An Introduction

0 comments:

Post a Comment

Popular Posts

New Research

SAY HELLO TO ME

ADDRESS

EMAIL

TELEPHONE

MOBILE