Abstract
এই কাগজে, আমরা gcForest প্রস্তাব, কর্মের বিস্তৃত পরিসরে deep neural networks গুলির সাথে অত্যন্ত প্রতিযোগিতামূলক পারফরম্যান্সের সাথে একটি decision tree-র নকশাকর পদ্ধতির উপস্থিতি। hyper-parameter tuning এর great effort করার জন্য deep neural networks গুলির বিপরীতে, gcForest প্রশিক্ষণ দেওয়া অনেক সহজ; এমনকি যখন এটি আমাদের পরীক্ষায় different domains গুলিতে different data প্রয়োগ করা হয়, hyper-parameters গুলির প্রায় একই সেটিংস দ্বারা excellent performance অর্জন করা যায়। gcForest-র training process টি efficient/কার্যকর, এবং ব্যবহারকারীগণ computational resource অনুসারে training cost, control করতে পারেন। efficiency আরও বর্ধিত হতে পারে কারণ gcForest স্বাভাবিকভাবেই সমান্তরাল বাস্তবায়নের জন্য প্রস্তুত। অধিকন্তু/Furthermore, deep neural networks গুলির বিপরীতে যেখানে largescale training data- প্রয়োজন, gcForest কেবলমাত্র small-scale training data থাকলেও ভাল কাজ করতে পারে।
- Introduction
সাম্প্রতিক বছরগুলিতে, deep neural network গুলি বিভিন্ন অ্যাপ্লিকেশনগুলিতে দুর্দান্ত সাফল্য অর্জন করেছে, particularly/বিশেষত visual and speech তথ্য সম্পর্কিত কাজগুলিতে [Krizhenvsky et al., 2012; Hinton et al., 2012], deep learning hot wave-র দিকে পরিচালিত করছে [Goodfellow et al., 2016]। deep neural networks গুলির মাধ্যমে শক্তিশালী হয়, তাদের স্পষ্টভাবে deficiencies/প্রতীয়মান রয়েছে। যদিও গdeep neural network গুলি শক্তিশালী, তবে তাদের স্পষ্টতই ভিন্নতা রয়েছে। প্রথমত, এটি সুপরিচিত যে প্রশিক্ষণের জন্য সাধারণত প্রচুর পরিমাণে training data প্রয়োজন হয়, ছোট মাপের ডেটা সহকারে সরাসরি প্রয়োগ করতে deep neural network গুলি অক্ষম করে। মনে রাখবেন, এমনকি বড় ডেটা যুগেও অনেক আসল কাজে লেবেলযুক্ত উচ্চ ব্যয়ের কারণে লেবেল যুক্ত ডেটাগুলির পরিমাণ পর্যাপ্ত পরিমাণের থেকে কম থাকে, যার ফলে সেই কাজগুলিতে গভীর স্নায়বিক নেটওয়ার্কগুলির নিম্ন কর্মক্ষমতা দেখা দেয়। দ্বিতীয়ত, deep neural network গুলি খুব জটিল মডেল এবং সাধারণত training process জন্য powerful computational facilities প্রয়োজন , learning ability কে পুরোপুরি কাজে লাগাতে big companies গুলি বাইরের ডাঁটা গ্রহণ করা। আরও গুরুত্বপূর্ণ, deep neural networks গুলি অনেকগুলি hyper-parameters গুলির সাথে থাকে এবং শিখার পারফরম্যান্স সেগুলির যত্ন সহকারে সুরক্ষার উপরে গুরুতরভাবে নির্ভর করে। উদাহরণের জন্য, যখন বেশ কয়েকটি লেখক সবাই কনভ্যুশনাল নিউরাল নেটওয়ার্ক ব্যবহার করেন [LeCun et al., 1998; Krizhenvsky et al., 2012; Simonyan and Zisserman, 2014], convolutional layer structures-র মতো বিভিন্ন বিকল্পের কারণে তারা প্রকৃতপক্ষে different learning models ব্যবহার করছে। এই সত্যটি কেবল deep neural networks গুলির training কেই খুব জটিল করে তোলে না, science/engineering র চেয়ে শিল্পের মতো, তবে deep neural network গুলির theoretical analysis ও extremely difficult। because , almost infinite configurational combinations সহ অনেকগুলি হস্তক্ষেপের কারণ আছে।
এটি ব্যাপকভাবে স্বীকৃত যে, deep neural networks গুলির জন্য representation learning ability অত্যন্ত গুরুত্বপূর্ণ। এটি আরও noteworthy/ লক্ষণীয় যে, large training ডেটা ব্যবহার করতে, learning models গুলির capacity বড় হওয়া উচিত; এটি আংশিকভাবে ব্যাখ্যা করে যে, গভীর নিউরাল নেটওয়ার্কগুলি কেন খুব জটিল, support vector machines (SVM)-র মতো ordinary learning মডেলগুলির চেয়ে অনেক জটিল। আমরা অনুমান করি যে, আমরা যদি এই বৈশিষ্ট্যগুলি কিছু অন্যান্য উপযুক্ত ফর্মের মডেলগুলিতে প্রদান করতে পারি তবে আমরা deep neural network গুলির সাথে performance competitive অর্জন করতে সক্ষম হতে পারি তবে কম উল্লিখিত deficiencies/ঘাটতি।
এই গবেষণাপত্রে, আমরা gcForest (multi-Grained Cascade Forest) প্রস্তাব করছি, একটি অভিনব decision tree-র নকশা পদ্ধতি। এই পদ্ধতিটি একটি deep forest তৈরি করে, একটি ক্যাসকেড কাঠামো যা gcForest কে উপস্থাপনা শেখার জন্য সক্ষম করে। যখন ইনপুটগুলি high dimensional সাথে থাকে, সম্ভাব্যভাবে gcForest কে contextual or structural aware/প্রাসঙ্গিক বা কাঠামোগত সচেতন করতে সক্ষম করে তখন এর representational learning ability টি আরও multi-grained scanning-র মাধ্যমে বাড়ানো যেতে পারে। cascade levels সংখ্যাটি adaptive/অভিযোজিত হিসাবে নির্ধারণ করা যেতে পারে যে, model complexity স্বয়ংক্রিয়ভাবে সেট হয়ে যেতে পারে, এমনকি small-scale data ও gcForest কে দুর্দান্তভাবে সম্পাদন করতে সক্ষম করা। Moreover, ব্যবহারকারীগণ উপলব্ধ গণ্য সংস্থান অনুসারে training costs নিয়ন্ত্রণ করতে পারেন। deep neural networks গুলির তুলনায় gcForest র hyper-parameters গুলি কম রয়েছে; আরও ভাল খবর এটির পারফরম্যান্স hyper-parameter settings থেকে বেশ মজবুত, যেমন বেশিরভাগ ক্ষেত্রে, এমনকি different domains-র different data জুড়ে, এটি default setting ব্যবহার করে excellent performance পেতে সক্ষম। এটি কেবল gcForest র training কে সুবিধাজনক করে তোলে না, theoretical analysis, যদিও এই কাগজের সুযোগের বাইরে, deep neural networks গুলির চেয়ে সম্ভাব্য সহজ (এটি বলা বাহুল্য যে, tree learners গুলি সাধারণত neural networks গুলির চেয়ে analyze করা সহজ)। আমাদের পরীক্ষায়, gcForest deep neural networks গুলিতে অত্যন্ত competitive performance অর্জন করেছে, যদিও gcForest এর training time cost deep neural networks গুলির চেয়ে ছোট।
cascade forest structure-র Illustration/চিত্র। ধরুন ক্যাসকেডের প্রতিটি স্তরে two random forests (black) and two completely-random tree forests (blue) থাকে। ধরুন, predict করার জন্য এখানে three classes রয়েছে; সুতরাং, প্রতিটি forest একটি three-dimensional class vector আউটপুট দেবে, যা original inputটির re-representation-র জন্য সংক্ষিপ্ত করে।
এই গবেষণাপত্রে, আমরা gcForest (multi-Grained Cascade Forest) প্রস্তাব করছি, একটি অভিনব decision tree-র নকশা পদ্ধতি। এই পদ্ধতিটি একটি deep forest তৈরি করে, একটি ক্যাসকেড কাঠামো যা gcForest কে উপস্থাপনা শেখার জন্য সক্ষম করে। যখন ইনপুটগুলি high dimensional সাথে থাকে, সম্ভাব্যভাবে gcForest কে contextual or structural aware/প্রাসঙ্গিক বা কাঠামোগত সচেতন করতে সক্ষম করে তখন এর representational learning ability টি আরও multi-grained scanning-র মাধ্যমে বাড়ানো যেতে পারে। cascade levels সংখ্যাটি adaptive/অভিযোজিত হিসাবে নির্ধারণ করা যেতে পারে যে, model complexity স্বয়ংক্রিয়ভাবে সেট হয়ে যেতে পারে, এমনকি small-scale data ও gcForest কে দুর্দান্তভাবে সম্পাদন করতে সক্ষম করা। Moreover, ব্যবহারকারীগণ উপলব্ধ গণ্য সংস্থান অনুসারে training costs নিয়ন্ত্রণ করতে পারেন। deep neural networks গুলির তুলনায় gcForest র hyper-parameters গুলি কম রয়েছে; আরও ভাল খবর এটির পারফরম্যান্স hyper-parameter settings থেকে বেশ মজবুত, যেমন বেশিরভাগ ক্ষেত্রে, এমনকি different domains-র different data জুড়ে, এটি default setting ব্যবহার করে excellent performance পেতে সক্ষম। এটি কেবল gcForest র training কে সুবিধাজনক করে তোলে না, theoretical analysis, যদিও এই কাগজের সুযোগের বাইরে, deep neural networks গুলির চেয়ে সম্ভাব্য সহজ (এটি বলা বাহুল্য যে, tree learners গুলি সাধারণত neural networks গুলির চেয়ে analyze করা সহজ)। আমাদের পরীক্ষায়, gcForest deep neural networks গুলিতে অত্যন্ত competitive performance অর্জন করেছে, যদিও gcForest এর training time cost deep neural networks গুলির চেয়ে ছোট।
cascade forest structure-র Illustration/চিত্র। ধরুন ক্যাসকেডের প্রতিটি স্তরে two random forests (black) and two completely-random tree forests (blue) থাকে। ধরুন, predict করার জন্য এখানে three classes রয়েছে; সুতরাং, প্রতিটি forest একটি three-dimensional class vector আউটপুট দেবে, যা original inputটির re-representation-র জন্য সংক্ষিপ্ত করে।
0 comments:
Post a Comment