এই পোস্টটি সাপোর্ট ভেক্টর মেশিনে (এসভিএম) একটি পোস্টের সিরিজের প্রথম অংশ যা আপনাকে এসভিএমগুলি এবং কীভাবে তারা কাজ করে সে সম্পর্কে একটি সাধারণ ধারণা দেয়।
SVM কি?
SVM হ'ল একটি মেশিন লার্নিং কৌশল যা রিগ্রেশন এবং শ্রেণিবিন্যাস উভয় সমস্যার জন্য ব্যবহার করা যেতে পারে। এটি একটি সম্ভাব্য সর্বোত্তম উপায়ে একটি ডেটাসেটকে বিভিন্ন শ্রেণিতে আলাদা করার জন্য বহুমাত্রিক স্থানে একটি (hyperplane)হাইপারপ্লেন তৈরি করে। SVM সম্পর্কে অধ্যয়ন করার সময় আপনি নিয়মিত কিছু শর্তাবলী তে আসবেন:
- Hyperplane — হাইপারপ্লেন একটি decision plane যা পৃথক করে ডেটাগুলির সেটকে শ্রেণিবদ্ধ করে
- Support vectors — the data points closest to the hyperplane Support vectorsসমর্থন ভেক্টর - হাইপারপ্লেনের নিকটতম ডেটা পয়েন্টগু
- Margin — the distance between the hyperplane and the nearest data point from either set (hyperplane and the nearest data পয়েন্ট উভয় সেট এর মধ্যে দূরত্ব)
তারা কিভাবে কাজ করে?
একটি উদাহরণ নেওয়া যাক। বলুন আপনার কাছে দুটি ধরণের ডেটা রয়েছে। এই ডেটাটিকে দুটি শ্রেণিতে বিভক্ত করতে বিভিন্ন হাইপারপ্লেন ব্যবহার করা যেতে পারে (চিত্র 2)। একটি এসভিএমের কাজটি হ'ল optimal plane টি সন্ধান করা যা ডেটাসেটকে দুটি শ্রেণিতে সবচেয়ে ভালভাবে পৃথক করে, অর্থাত্ হাইপারপ্লেন যার জন্য মার্জিন maximum।
কোনও SVM অনুকূল হাইপারপ্লেনকে যেভাবে (manner)স্বীকৃতি দেয় তা নিম্নরূপ,
- plane and the support vectors গুলির মধ্যে দূরত্ব গণনা করে (মার্জিন)
- optimal hyperplane টি হ'ল (plane)সমতল যা উভয় পাশের নিকটতম ডেটা পয়েন্ট থেকে সর্বাধিক দূরত্বে থাকে
What is the kernel trick?কার্নেলের কৌশলটি কী?
কখনও কখনও প্রদত্ত ডেটা রৈখিকভাবে পৃথকযোগ্য নাও হতে পারে। লিনিয়ার হাইপারপ্লেন ব্যবহার করে এই জাতীয় সমস্যাগুলি সমাধান করা যায় না। এই পরিস্থিতিতে, এসভিএম ইনপুট স্থানটিকে একটি উচ্চতর মাত্রিক স্থানগুলিতে রূপান্তর করতে কার্নেলগুলি ব্যবহার করে।
কার্নেল এমন একটি ফাংশন যা নিম্ন মাত্রিক plane টি একটি উচ্চ মাত্রিক স্থানে রাখে। এটি কোনও উচ্চতর মাত্রিক স্থানে ডেটা প্রজেকশনকে space or জায়গা দেয় যেখানে এটি plane (চিত্র 3) ব্যবহার করে পৃথক করা যায়। সহজ কথায়, এটি এর সাথে আরও মাত্রা যুক্ত করে বিভাজ্যগুলিতে linearly inseparable ভাবে অবিচ্ছেদ্য উপাত্তগুলিতে রূপান্তর করে।
There are 3 main types of kernels used by SVMs,
- Linear Kernel — The dot product between two given observations
- Polynomial Kernel — Allows curved lines in the input space
- Radial Basis Function(RBF) Kernel — Can create complex regions within the feature space
- Linear Kernel - প্রদত্ত দুটি পর্যবেক্ষণের মধ্যে dot product
- Polynomial Kernel - ইনপুট স্পেসে বাঁকা লাইনগুলিকে মঞ্জুরি দেয়
- Radial Basis Function(RBF) Kernel - বৈশিষ্ট্য জায়গার মধ্যে জটিল অঞ্চল তৈরি করতে পারে
আপনি যদি কার্নেলের ধরণ এবং তাদের পিছনে গণিত সম্পর্কে আরও জানতে চান তবে আমি উল্লেখ বিভাগে কিছু চমত্কার নিবন্ধগুলি অন্তর্ভুক্ত করেছি। এটি আমাদের এই পোস্টের শেষে নিয়ে আসে। আশা করি এটি আপনাকে এসভিএমগুলি এবং তারা কীভাবে কাজ করে সে সম্পর্কে একটি উচ্চ পর্যায়ের বোঝাপড়া পেতে সহায়তা করেছে। এই সিরিজের দ্বিতীয় অংশটি here. পাওয়া যাবে।
0 comments:
Post a Comment