কম্পিউটার দৃষ্টি একটি অন্তর্বর্তী বৈজ্ঞানিক ক্ষেত্র যা ডিজিটাল চিত্রগুলি বা ভিডিওগুলি থেকে উচ্চ-স্তরের বোঝার জন্য কম্পিউটারগুলি কীভাবে তৈরি করা যায় তার সাথে সম্পর্কিত। প্রকৌশল দৃষ্টিকোণ থেকে, এটি মানব চাক্ষুষ সিস্টেম করতে পারেন যে কাজ স্বয়ংক্রিয় করতে চায়

what computer vision consist of :
কৃত্রিম বুদ্ধিমত্তা ক্ষেত্রগুলি স্বায়ত্বশাসিত পরিকল্পনা বা রোবোটিক্যাল সিস্টেমের জন্য বিতর্কের মাধ্যমে পরিবেশের মাধ্যমে নেভিগেট করতে পারে। তাদের মাধ্যমে নেভিগেট করার জন্য এই পরিবেশগুলির একটি বিস্তারিত বোঝার প্রয়োজন। পরিবেশ সম্পর্কে তথ্য কম্পিউটার দৃষ্টি সিস্টেম দ্বারা সরবরাহ করা যেতে পারে, দৃষ্টি সেন্সর হিসাবে কাজ করা এবং পরিবেশ এবং রোবট সম্পর্কে উচ্চ স্তরের তথ্য সরবরাহ করা।
কৃত্রিম বুদ্ধিমত্তা এবং কম্পিউটার দৃষ্টি যেমন প্যাটার্ন স্বীকৃতি এবং শেখার কৌশল অন্যান্য বিষয় শেয়ার করুন। ফলস্বরূপ, কম্পিউটার দৃষ্টি কখনও কখনও কৃত্রিম বুদ্ধিমত্তা ক্ষেত্র বা কম্পিউটার বিজ্ঞান ক্ষেত্রের অংশ হিসাবে দেখা হয়।
Information engineering
কম্পিউটার দৃষ্টি প্রায়ই তথ্য প্রকৌশল অংশ বলে মনে করা হয়।
নিউরোবায়োলজিNeurobiology
একটি তৃতীয় ভূমিকা যা একটি গুরুত্বপূর্ণ ভূমিকা পালন করে neurobiology, বিশেষত জৈব দৃষ্টি সিস্টেম গবেষণা। গত শতাব্দীতে, মানুষের এবং বিভিন্ন প্রাণী উভয় ক্ষেত্রে চাক্ষুষ উদ্দীপনার প্রক্রিয়াকরণের জন্য নিবেদিত চোখ, নিউরন এবং মস্তিষ্কের কাঠামোর ব্যাপক গবেষণা হয়েছে। এর ফলে কিছু দৃষ্টি-সম্পর্কিত কাজগুলি সমাধান করার জন্য "বাস্তব" দৃষ্টি সিস্টেমগুলি কীভাবে পরিচালিত হয় তার বিবরণটি একটি মোটা, জটিল হলেও বর্ণনা করে। এই ফলাফল কম্পিউটার দৃষ্টিভঙ্গির মধ্যে একটি সাবফিল্ডের দিকে পরিচালিত করেছে যেখানে কৃত্রিম সিস্টেমগুলি জটিলতার বিভিন্ন স্তরে জৈবিক ব্যবস্থার প্রক্রিয়াকরণ এবং আচরণের অনুকরণ করার জন্য ডিজাইন করা হয়েছে। এছাড়াও, কম্পিউটার দৃষ্টিভঙ্গির মধ্যে উন্নত কিছু শেখার ভিত্তিক পদ্ধতিগুলি (উদাহরণস্বরূপ e.g.neural net and deep learning ভিত্তিক চিত্র এবং বৈশিষ্ট্য বিশ্লেষণ এবং শ্রেণীবিভাগ) জীববিজ্ঞানে তাদের পটভূমি রয়েছে।
Signal processing
তবুও কম্পিউটার দৃষ্টি সম্পর্কিত আরেকটি ক্ষেত্র signal processing। এক ভেরিয়েবল সিগন্যালগুলির প্রক্রিয়া করার জন্য অনেক পদ্ধতি, সাধারণত সাময়িক সংকেত, কম্পিউটার দৃষ্টিভঙ্গিতে দুইটি পরিবর্তনশীল সংকেত বা মাল্টি-পরিবর্তনশীল সংকেতগুলির প্রক্রিয়াকরণের প্রাকৃতিক পদ্ধতিতে প্রসারিত করা যেতে পারে। যাইহোক, চিত্রের নির্দিষ্ট প্রকৃতির কারণে কম্পিউটার দৃষ্টিভঙ্গির মধ্যে অনেকগুলি পদ্ধতি রয়েছে যা একটি পরিবর্তনশীল সিগন্যালগুলির প্রক্রিয়াকরণে কোন সদৃশ নেই। সিগন্যালের বহু-মাত্রিকতার সাথে, এটি কম্পিউটার দৃষ্টিভঙ্গির অংশ হিসাবে সংকেত প্রক্রিয়াকরণে একটি উপক্ষেত্রকে সংজ্ঞায়িত করে।
কম্পিউটার দৃষ্টি, ইমেজ প্রসেসিং, এবং machine vision ক্লাসিক্যাল সমস্যাটি হল চিত্রের ডেটা নির্দিষ্ট কিছু, বৈশিষ্ট্য, বা কার্যকলাপ রয়েছে কিনা তা নির্ণয় করা হয়। স্বীকৃতি সমস্যার বিভিন্ন ধরণের সাহিত্যে বর্ণনা করা হয়েছে: [উদ্ধৃতি প্রয়োজন]
অবজেক্ট স্বীকৃতি (বস্তু শ্রেণীবদ্ধকরণও বলা হয়) - এক বা একাধিক পূর্বনির্ধারিত বা শিখানো বস্তু বা বস্তু ক্লাস সনাক্ত করা যেতে পারে, সাধারণত ছবিতে তাদের 2 ডি অবস্থানের সাথে বা 3D দৃশ্যটিতে ভঙ্গ করে। ব্লিপ্পার, গুগল গগলস এবং লাইকট্যাট এই কার্যকারিতাটিকে চিত্রিত করে এমন একচেটিয়া প্রোগ্রাম সরবরাহ করে।
Identification
সনাক্তকরণ - একটি বস্তুর একটি পৃথক উদাহরণ স্বীকৃত হয়। উদাহরণগুলির মধ্যে একটি নির্দিষ্ট ব্যক্তির মুখ বা আঙ্গুলের ছাপ সনাক্তকরণ, হস্তলিখিত সংখ্যা সনাক্তকরণ, বা একটি নির্দিষ্ট গাড়ির সনাক্তকরণ অন্তর্ভুক্ত।
সনাক্তকরণ - ইমেজ তথ্য একটি নির্দিষ্ট অবস্থার জন্য স্ক্যান করা হয়। উদাহরণগুলিতে চিকিৎসা চিত্রগুলিতে সম্ভাব্য অস্বাভাবিক কোষ বা টিস্যু সনাক্তকরণ বা একটি স্বয়ংক্রিয় রাস্তা টোল সিস্টেমের মধ্যে একটি গাড়ির সনাক্তকরণ অন্তর্ভুক্ত। অপেক্ষাকৃত সহজ এবং দ্রুত গণনাগুলির উপর ভিত্তি করে সনাক্তকরণটি কখনও কখনও আকর্ষণীয় ইমেজ ডেটার ছোট অঞ্চলের সন্ধানের জন্য ব্যবহৃত হয় যা আরও সঠিকভাবে ব্যাখ্যা করার জন্য আরও বেশি কম্পিউটেশালিভাবে দাবি করার কৌশলগুলি দ্বারা বিশ্লেষণ করা যেতে পারে।
বর্তমানে, এই ধরনের কাজগুলির জন্য সেরা অ্যালগরিদমগুলি সংশ্লেষিক স্নায়ুতন্ত্রের উপর ভিত্তি করে। তাদের ক্ষমতাগুলির একটি চিত্র চিত্র চিত্র বৃহৎ স্কেল ভিজ্যুয়াল রেকগনিশন চ্যালেঞ্জ দ্বারা দেওয়া হয়; এটি বস্তু শ্রেণীবদ্ধকরণ এবং সনাক্তকরণের একটি বেঞ্চমার্ক, লক্ষ লক্ষ চিত্র এবং শত শত অবজেক্ট ক্লাসের সাথে। ImageNet পরীক্ষাগুলিতে কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলির পারফরম্যান্স এখন মানুষের কাছে ঘনিষ্ঠ। [26] সেরা অ্যালগরিদম এখনও ছোট বা পাতলা বস্তুর সাথে লড়াই করে, যেমন একটি ফুলের ডালপালা বা তাদের হাতে একটি কুইল থাকা ব্যক্তি। তারা ফিল্টারগুলির সাথে বিকৃত হয়েছে এমন চিত্রগুলির সাথেও সমস্যা রয়েছে (আধুনিক ডিজিটাল ক্যামেরাগুলির সাথে ক্রমবর্ধমান সাধারণ ঘটনা)। বিপরীতে, এই ধরনের চিত্রগুলি খুব কমই মানুষের সমস্যার সৃষ্টি করে। মানুষ, তবে, অন্যান্য বিষয় সঙ্গে সমস্যা আছে ঝোঁক। উদাহরণস্বরূপ, তারা সূক্ষ্ম কুকুরের শ্রেণিতে যেমন কুকুরের নির্দিষ্ট জাত বা প্রজাতির প্রজাতিগুলিতে শ্রেণিবদ্ধ শ্রেণিতে শ্রেণীবদ্ধ নয়, তেমনি কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলি সহজেই এটি পরিচালনা করে।
Several specialized tasks based on recognition exist, such as:স্বীকৃতি উপর ভিত্তি করে বিভিন্ন বিশেষ কাজ বিদ্যমান, যেমন:
Content-based image retrieval –সামগ্রী-ভিত্তিক চিত্র পুনরুদ্ধার - একটি নির্দিষ্ট সামগ্রীর চিত্রগুলির একটি বড় সেটের সমস্ত চিত্র খুঁজে বের করা। বিষয়বস্তুটি বিভিন্ন উপায়ে নির্দিষ্ট করা যেতে পারে, উদাহরণস্বরূপ মিলটির অনুরূপ একটি লক্ষ্য চিত্র (ইমেজ এক্স এর মতো সব ছবি আমাকে দিন), বা পাঠ্য ইনপুট হিসাবে দেওয়া উচ্চ-স্তরের অনুসন্ধানের মানদণ্ডের পরিপ্রেক্ষিতে (আমাকে সব ছবিগুলি অন্তর্ভুক্ত করুন অনেক ঘর, শীতকালে সময় নেওয়া হয়, এবং তাদের কোন গাড়ী আছে)।
- Pose estimationআনুমানিক মূল্যায়ন - ক্যামেরা সম্পর্কিত একটি নির্দিষ্ট বস্তুর অবস্থান বা অভিযোজন অনুমান করা। এই পদ্ধতির জন্য একটি উদাহরণ অ্যাপ্লিকেশন একটি সমাবেশ লাইন পরিস্থিতি বা একটি বিন থেকে অংশ বাছাই একটি কনভেয়র বেল্ট থেকে বস্তু পুনরুদ্ধার করতে একটি রোবট আর্ম সাহায্য করবে।
- Optical character recognition (OCR)অপটিক্যাল ক্যারেক্টার স্বীকৃতি (ওসিআর) - মুদ্রিত বা হস্তাক্ষরযুক্ত charactersচিত্রগুলির চিত্রগুলিতে অক্ষর চিহ্নিত করা, সাধারণত editing or indexing (e.g. ASCII).সম্পাদনা বা সূচী (উদাঃ ASCII) এ আরও কার্যকর করার জন্য ফরম্যাটে পাঠ্য এনকোড করার দৃশ্যের সাথে
- 2D code reading – reading of 2D codes such as data matrix and QR codes
- Shape Recognition Technology (SRT) in people counter systems differentiating human beings (head and shoulder patterns) from objects
0 comments:
Post a Comment