• Deep Forest: Towards an Alternative to Deep Neural Networks

    Deep Forest: Towards an Alternative to Deep Neural Networks

    Abstract
    এই কাগজে, আমরা gcForest প্রস্তাব, কর্মের বিস্তৃত পরিসরে deep neural networks গুলির সাথে অত্যন্ত প্রতিযোগিতামূলক পারফরম্যান্সের সাথে একটি decision tree-র নকশাকর পদ্ধতির উপস্থিতি। hyper-parameter tuning এর great effort করার জন্য deep neural networks গুলির বিপরীতে, gcForest প্রশিক্ষণ দেওয়া অনেক সহজ; এমনকি যখন এটি আমাদের পরীক্ষায় different domains গুলিতে  different data প্রয়োগ করা হয়, hyper-parameters গুলির প্রায় একই সেটিংস দ্বারা excellent performance অর্জন করা যায়। gcForest-র training process টি efficient/কার্যকর, এবং ব্যবহারকারীগণ computational resource অনুসারে training cost, control করতে পারেন। efficiency  আরও বর্ধিত হতে পারে কারণ gcForest স্বাভাবিকভাবেই সমান্তরাল বাস্তবায়নের জন্য প্রস্তুত। অধিকন্তু/Furthermore, deep neural networks গুলির বিপরীতে যেখানে  largescale training data- প্রয়োজন, gcForest কেবলমাত্র small-scale training data থাকলেও ভাল কাজ করতে পারে।

    1. Introduction
    সাম্প্রতিক বছরগুলিতে, deep neural network গুলি বিভিন্ন অ্যাপ্লিকেশনগুলিতে দুর্দান্ত সাফল্য অর্জন করেছে, particularly/বিশেষত visual and speech তথ্য সম্পর্কিত কাজগুলিতে [Krizhenvsky et al., 2012; Hinton et al., 2012], deep learning hot wave-র দিকে পরিচালিত করছে [Goodfellow et al., 2016]। deep neural networks গুলির মাধ্যমে শক্তিশালী হয়, তাদের স্পষ্টভাবে deficiencies/প্রতীয়মান রয়েছে। যদিও গdeep neural network গুলি শক্তিশালী, তবে তাদের স্পষ্টতই  ভিন্নতা  রয়েছে। প্রথমত, এটি সুপরিচিত যে প্রশিক্ষণের জন্য সাধারণত প্রচুর পরিমাণে training data  প্রয়োজন হয়, ছোট মাপের ডেটা সহকারে সরাসরি প্রয়োগ করতে  deep neural network গুলি অক্ষম করে। মনে রাখবেন, এমনকি বড় ডেটা যুগেও অনেক আসল কাজে লেবেলযুক্ত উচ্চ ব্যয়ের কারণে লেবেল যুক্ত ডেটাগুলির পরিমাণ পর্যাপ্ত পরিমাণের থেকে কম থাকে, যার ফলে সেই কাজগুলিতে গভীর স্নায়বিক নেটওয়ার্কগুলির নিম্ন কর্মক্ষমতা দেখা দেয়। দ্বিতীয়ত, deep neural network গুলি খুব জটিল মডেল এবং সাধারণত training process  জন্য  powerful computational facilities প্রয়োজন  , learning ability কে পুরোপুরি কাজে লাগাতে big companies গুলি বাইরের ডাঁটা  গ্রহণ করা। আরও গুরুত্বপূর্ণ, deep neural networks গুলি অনেকগুলি hyper-parameters গুলির সাথে থাকে এবং শিখার পারফরম্যান্স সেগুলির যত্ন সহকারে সুরক্ষার উপরে গুরুতরভাবে নির্ভর করে। উদাহরণের জন্য, যখন বেশ কয়েকটি লেখক সবাই কনভ্যুশনাল নিউরাল নেটওয়ার্ক ব্যবহার করেন [LeCun et al., 1998; Krizhenvsky et al., 2012; Simonyan and Zisserman, 2014], convolutional layer structures-র মতো বিভিন্ন বিকল্পের কারণে তারা প্রকৃতপক্ষে different learning models ব্যবহার করছে। এই সত্যটি কেবল deep neural networks গুলির training কেই খুব জটিল করে তোলে না, science/engineering র চেয়ে শিল্পের মতো, তবে deep neural network গুলির theoretical analysis ও extremely difficult।  because ,  almost infinite  configurational combinations সহ অনেকগুলি হস্তক্ষেপের কারণ আছে। 

    এটি ব্যাপকভাবে স্বীকৃত যে, deep neural networks গুলির জন্য representation learning ability অত্যন্ত গুরুত্বপূর্ণ। এটি আরও noteworthy/ লক্ষণীয় যে,  large training ডেটা ব্যবহার করতে, learning models গুলির capacity বড় হওয়া উচিত; এটি আংশিকভাবে ব্যাখ্যা করে যে, গভীর নিউরাল নেটওয়ার্কগুলি কেন খুব জটিল, support vector machines (SVM)-র মতো  ordinary learning  মডেলগুলির চেয়ে অনেক জটিল। আমরা অনুমান করি যে, আমরা যদি এই বৈশিষ্ট্যগুলি কিছু অন্যান্য উপযুক্ত ফর্মের মডেলগুলিতে প্রদান করতে পারি তবে আমরা deep neural network গুলির সাথে performance competitive অর্জন করতে সক্ষম হতে পারি তবে কম উল্লিখিত deficiencies/ঘাটতি।

    এই গবেষণাপত্রে, আমরা gcForest (multi-Grained Cascade Forest) প্রস্তাব করছি, একটি অভিনব decision tree-র নকশা পদ্ধতি। এই পদ্ধতিটি একটি deep forest তৈরি করে,  একটি ক্যাসকেড কাঠামো যা gcForest কে উপস্থাপনা শেখার জন্য সক্ষম করে। যখন ইনপুটগুলি high dimensional  সাথে থাকে, সম্ভাব্যভাবে gcForest কে  contextual or structural aware/প্রাসঙ্গিক বা কাঠামোগত সচেতন করতে সক্ষম করে তখন এর representational learning ability টি আরও multi-grained scanning-র মাধ্যমে বাড়ানো যেতে পারে। cascade levels  সংখ্যাটি adaptive/অভিযোজিত হিসাবে নির্ধারণ করা যেতে পারে যে, model complexity স্বয়ংক্রিয়ভাবে সেট হয়ে যেতে পারে, এমনকি small-scale data ও gcForest কে দুর্দান্তভাবে সম্পাদন করতে সক্ষম করা।  Moreover, ব্যবহারকারীগণ উপলব্ধ গণ্য সংস্থান অনুসারে  training costs নিয়ন্ত্রণ করতে পারেন। deep neural networks গুলির তুলনায় gcForest র hyper-parameters গুলি কম রয়েছে;  আরও ভাল খবর এটির পারফরম্যান্স hyper-parameter settings থেকে বেশ মজবুত, যেমন বেশিরভাগ ক্ষেত্রে, এমনকি different domains-র different data জুড়ে, এটি default setting ব্যবহার করে excellent performance পেতে সক্ষম। এটি কেবল gcForest র training কে সুবিধাজনক করে তোলে না, theoretical analysis, যদিও এই কাগজের সুযোগের বাইরে, deep neural networks  গুলির চেয়ে সম্ভাব্য সহজ (এটি বলা বাহুল্য যে, tree learners গুলি সাধারণত neural networks গুলির চেয়ে analyze করা সহজ)। আমাদের পরীক্ষায়, gcForest  deep neural networks গুলিতে অত্যন্ত competitive performance অর্জন করেছে, যদিও gcForest এর training time cost deep neural networks গুলির  চেয়ে ছোট।


    cascade forest structure-র Illustration/চিত্র। ধরুন ক্যাসকেডের প্রতিটি স্তরে  two random forests (black) and two completely-random tree forests (blue) থাকে। ধরুন,  predict করার জন্য এখানে three classes রয়েছে; সুতরাং, প্রতিটি forest  একটি three-dimensional class vector আউটপুট দেবে, যা original inputটির re-representation-র জন্য সংক্ষিপ্ত করে।






































  • 0 comments:

    Post a Comment

    New Research

    Attention Mechanism Based Multi Feature Fusion Forest for Hyperspectral Image Classification.

    CBS-GAN: A Band Selection Based Generative Adversarial Net for Hyperspectral Sample Generation.

    Multi-feature Fusion based Deep Forest for Hyperspectral Image Classification.

    ADDRESS

    388 Lumo Rd, Hongshan, Wuhan, Hubei, China

    EMAIL

    contact-m.zamanb@yahoo.com
    mostofa.zaman@cug.edu.cn

    TELEPHONE

    #
    #

    MOBILE

    +8615527370302,
    +8807171546477