• A survey of remote sensing image classification based on CNNs


    ABSTRACT

    পৃথিবী পর্যবেক্ষণ প্রযুক্তির বিকাশের সাথে, অধিগ্রহণ করা রিমোট সেন্সিং চিত্রগুলি নাটকীয়ভাবে বৃদ্ধি পাচ্ছে, এবং দূরবর্তী সেন্সিংয়ের বড় ডেটার একটি নতুন যুগ আসছে। দূরবর্তী সেন্সিং ডেটাগুলির এই বিশাল পরিমাণগুলিকে কার্যকরভাবে কীভাবে খনন করা যায় তা নতুন চ্যালেঞ্জ। ডিপ লার্নিং এই রিমোট সেন্সিং ডেটা বিশ্লেষণের জন্য একটি নতুন পদ্ধতির সরবরাহ করে। গভীর শেখার মডেলগুলির মধ্যে একটি হিসাবে, কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলি (সিএনএন) সরাসরি প্রচুর পরিমাণে চিত্রাবলীর ডেটা থেকে বৈশিষ্ট্যগুলি বের করতে পারে এবং চিত্রাবলীর ডেটাগুলির শব্দার্থক বৈশিষ্ট্যগুলি শোষণে ভাল। সিএনএনগুলি কম্পিউটার দর্শনে অসাধারণ সাফল্য অর্জন করেছে। সাম্প্রতিক বছরগুলিতে, বেশ কিছু গবেষক সিএনএন ব্যবহার করে রিমোট সেন্সিং চিত্রের শ্রেণিবিন্যাস অধ্যয়ন করেছেন এবং সিএনএনগুলি দ্রুত, অর্থনৈতিক এবং নির্ভুল বিশ্লেষণ এবং দূরবর্তী সেন্সিং ডেটা থেকে বৈশিষ্ট্য নিষ্কাশন উপলব্ধি করতে প্রয়োগ করা যেতে পারে। এই কাগজটি প্রত্যন্ত সংবেদনশীল চিত্রের শ্রেণিবিন্যাসে সিএনএন-ভিত্তিক গভীর শিক্ষার বর্তমানের অত্যাধুনিক প্রয়োগের সমীক্ষা সরবরাহ করার লক্ষ্যে রয়েছে। আমরা প্রথমে সিএনএনগুলির নীতি ও বৈশিষ্ট্য সংক্ষেপে পরিচয় করিয়ে দিই। তারপরে আমরা সিএনএন মডেলগুলির বিকাশ এবং কাঠামোগত উন্নতিগুলি জরিপ করি যা সিএনএনকে রিমোট সেন্সিং চিত্রের শ্রেণিবিন্যাসের জন্য আরও উপযুক্ত করে তোলে, রিমোট সেন্সিং চিত্রের শ্রেণিবদ্ধকরণের জন্য উপলব্ধ ডেটাসেট এবং ডেটা বৃদ্ধির কৌশলগুলি। তারপরে, রিমোট সেন্সিং চিত্রের শ্রেণিবিন্যাসে তিনটি সাধারণ সিএনএন অ্যাপ্লিকেশন কেস: দৃশ্যের শ্রেণিবিন্যাস, অবজেক্ট সনাক্তকরণ এবং অবজেক্ট বিভাগকরণ উপস্থাপন করা হয়। আমরা সিএনএন-ভিত্তিক রিমোট সেন্সিং ইমেজ শ্রেণিবদ্ধকরণের সমস্যা ও চ্যালেঞ্জগুলিও আলোচনা করি এবং সংশ্লিষ্ট পদক্ষেপ এবং পরামর্শগুলি প্রস্তাব করি। আমরা আশা করি যে জরিপটি রিমোট সেন্সিং ইমেজ শ্রেণিবদ্ধকরণ গবেষণার অগ্রগতি সহজতর করতে পারে এবং রিমোট সেন্সিং বিজ্ঞানীদের অত্যাধুনিক গভীর শেখার অ্যালগরিদম এবং কৌশলগুলির সাথে শ্রেণিবিন্যাসের কাজগুলি মোকাবেলায় সহায়তা করতে পারে।


    1. Introduction

    পৃথিবী পর্যবেক্ষণ প্রযুক্তির বিকাশের সাথে সাথে ধীরে ধীরে একটি সংহত স্থান-বায়ু-স্থল বিশ্ব পর্যবেক্ষণ প্রতিষ্ঠিত হয়েছে। প্ল্যাটফর্মটিতে উপগ্রহ নক্ষত্রমণ্ডল, অমানবিক বিমান বাহিনী (ইউএভি) এবং গ্রাউন্ড সেন্সর নেটওয়ার্কগুলি রয়েছে, উচ্চ-রেজোলিউশন উপগ্রহ রিমোট সেন্সিং সিস্টেমের প্রধান অংশ হিসাবে রয়েছে। ফলস্বরূপ, পৃথিবী পর্যবেক্ষণ করার জন্য আমাদের বিস্তৃত ক্ষমতা অভূতপূর্ব স্তরে পৌঁছেছে (লি, ঝাং, এবং জিয়া, ২০১৪)। অর্জিত রিমোট সেন্সিং (আরএস) চিত্রগুলি ভলিউম, বেগ, বিভিন্নতা এবং মানের ক্ষেত্রে নাটকীয়ভাবে বৃদ্ধি পাচ্ছে। আরএস চিত্রগুলিতে বড় ডেটার পাশাপাশি অন্যান্য জটিল বৈশিষ্ট্যগুলির যেমন বৃহত বৈশিষ্ট্য রয়েছে যেমন উচ্চ মাত্রা (উচ্চ স্থানিক, অস্থায়ী এবং বর্ণালী রেজোলিউশন), একাধিক স্কেল (একাধিক স্থানিক এবং টেম্পোরাল স্কেলস) এবং অ-স্থির (আরএস চিত্রগুলি বিভিন্ন সময়ে অর্জিত) তাদের বৈশিষ্ট্যগুলির মধ্যে পরিবর্তিত হয়) (লি, লি, লিউ, জি, ও ইয়াং, 2015; লি, টং, লি, গং, এবং ঝাং, 2012; গান, লিউ, ওয়াং, এবং ল্যাভ, 2014; জাং, 2017)। কীভাবে কার্যকরভাবে বিশাল আরএস চিত্রগুলি থেকে কার্যকর তথ্য বের করা যায় তা একটি বিষয়টি রয়ে গেছে যা জরুরিভাবে সমাধান করা প্রয়োজন।

    আরএস ডেটা থেকে তথ্যের দক্ষ নিষ্কাশন সাধারনত চিত্রের শ্রেণিবদ্ধকরণ কৌশলগুলি দ্বারা অর্জিত হয়। আরএস চিত্রের শ্রেণিবিন্যাস এমন একটি প্রক্রিয়া যার মধ্যে প্রতিটি চিত্রের পিক্সেল বা ক্ষেত্রফল নির্দিষ্ট বর্ণ অনুসারে বর্ণালী বৈশিষ্ট্য, স্থানিক কাঠামোগত বৈশিষ্ট্য ইত্যাদির ভিত্তিতে শ্রেণিতে শ্রেণিবদ্ধ করা হয় (ঝাও, ২০১৩)। আরএস চিত্রের শ্রেণিবিন্যাসটি ভিজ্যুয়াল ব্যাখ্যাকে কাজে লাগায়, যার তুলনামূলকভাবে উচ্চতর নির্ভুলতা রয়েছে তবে একটি উচ্চ জনশক্তি ব্যয়ও রয়েছে এবং এইভাবে এটি বড় ডেটা যুগে দূরবর্তী সংবেদনের ডেটাগুলির বিশাল পরিমাণের জন্য দ্রুত প্রক্রিয়াকরণ চাহিদা পূরণ করতে পারে না। আরএস চিত্রের শ্রেণিবিন্যাসের জন্য অগভীর মেশিন শেখার পদ্ধতির দম্পতি রয়েছে are পদ্ধতিগুলি মূল ডেটাটিকে অনেকগুলি বৈশিষ্ট্যে রূপান্তরিত করে (যেমন রঙের স্থান, টেক্সচার এবং সময় সিরিজের সংমিশ্রণ)। যাইহোক, ডেটা ভলিউম এবং মাত্রা বৃদ্ধির সাথে, বিপুল সংখ্যক ডেটা ব্যান্ডের মধ্যে অন্তর্নিহিত সম্পর্কটি আরও বেশি বিমূর্ত, যা আরএস চিত্রের শ্রেণিবিন্যাসের জন্য কার্যকর বা অনুকূলিত বৈশিষ্ট্যগুলি ডিজাইন করা কঠিন করে তোলে। সুতরাং, শ্রেণিবদ্ধকরণ নির্ভুলতা সন্তোষজনক নয়। রিমোট সেন্সিং বিগ ডেটা সমন্বিত করতে, চিত্র শ্রেণিবদ্ধকরণ কৌশলগুলি পরিমাণগত, স্বয়ংক্রিয় এবং রিয়েল-টাইম হওয়া উচিত (লি, ২০০৮)। সুতরাং, কম্পিউটার ভিত্তিক স্বয়ংক্রিয় শ্রেণিবদ্ধকরণ কৌশলগুলি আরএস চিত্রের শ্রেণিবিন্যাসকে সামাল দেওয়ার ক্ষেত্রে ধীরে ধীরে মূলধারায় পরিণত হচ্ছে। কম্পিউটার ভিত্তিক আরএস চিত্রের শ্রেণিবদ্ধকরণ পদ্ধতিগুলিকে প্যারামেট্রিক এবং নন-প্যারামেট্রিক শ্রেণিবদ্ধকারী দুটি ধরণের মধ্যে শ্রেণীবদ্ধ করা যেতে পারে। প্যারামেট্রিক শ্রেণিবদ্ধগুলিতে সর্বাধিক সম্ভাবনা এবং সর্বনিম্ন দূরত্বের অ্যালগোরিদম অন্তর্ভুক্ত। এই শ্রেণিবদ্ধকারীরা ধরে নিয়েছে যে ডেটা শ্রেণিবিন্যাস প্রক্রিয়াতে একটি সাধারণ বিতরণ অনুসরণ করে। এই শ্রেণিবদ্ধদের মধ্যে অন্যান্য সহায়ক তথ্য প্রবর্তন করাও খুব কঠিন। শ্রেণিবিন্যাসের নির্ভুলতা খুব কমই প্রয়োজনীয়তার সাথে পূরণ করতে পারে যখন জটিল পৃথিবী পৃষ্ঠ থেকে প্রাপ্ত বৃহত পরিমাণে আরএস ডেটা (জিয়া, লি, তিয়ান, ও উ, ২০১১) সম্মুখীন হয়। বিপরীতে, সাপোর্ট ভেক্টর মেশিন (এসভিএম) (বাই, ঝাং, এবং ঝো, 2014; এলভি, শু, গং, গুও, এবং কো, 2017; তও, টান, ক্যা, এবং তিয়ান, ২০১১) সহ নন-প্যারাম্যাট্রিক শ্রেণিবদ্ধকরণগুলি এবং নিউরাল নেটওয়ার্ক (এনএন) অ্যালগরিদম (লুও, ঝো, এবং ইয়াং, 2001; তাং, দেং, হুয়াং, এবং ঝাও, 2014), এই ধারণার প্রয়োজন হয় না যে ডেটা একটি সাধারণ বিতরণ অনুসরণ করে। শ্রেণিবদ্ধকরণ প্রক্রিয়া দুটি স্তরের (চেং অ্যান্ড হান, 2016) জড়িত, যথা বৈশিষ্ট্য নিষ্কাশন এবং শ্রেণিবদ্ধ শিক্ষণ। প্রথম পর্যায়ে, বৈশিষ্ট্যগুলি পূর্ববর্তী মানুষের জ্ঞানের ভিত্তিতে ম্যানুয়ালি ডিজাইন করা হয়েছে। সাধারণ বৈশিষ্ট্য বর্ণনাকারীদের মধ্যে রয়েছে স্থানীয় বাইনারি প্যাটার্নস (এলবিপি) (ওজালা, পাইটিকাইনেন এবং মাইনপা, 2002), স্কেল-ইনভেরিয়েন্ট ফিচার ট্রান্সফর্ম (এসআইএফটি) (লো, 2004) এবং হিস্টোগ্রামগুলি ওরিয়েন্টেড গ্রেডিয়েন্টস (এইচওজি) (দালাল এন্ড ট্রিগস, 2005)। দ্বিতীয় পর্যায়ে, একটি শ্রেণিবদ্ধ ডিজাইন করা বৈশিষ্ট্যগুলির উপর ভিত্তি করে প্রশিক্ষিত হয়। প্যারামেট্রিক শ্রেণিবদ্ধের তুলনায়, নন-প্যারাম্যাট্রিক শ্রেণিবদ্ধীদের জটিল পৃথিবী পৃষ্ঠ থেকে প্রাপ্ত চিত্রগুলির জন্য উচ্চতর শ্রেণিবদ্ধকরণ যথার্থতা রয়েছে। যাইহোক, রিমোট সেন্সিং বিগ ডেটা শ্রেণীবদ্ধ করার জন্য নন-প্যারাম্যাট্রিক শ্রেণিবদ্ধীদের কিছু ঘাটতি রয়েছে। প্রথমত, বৈশিষ্ট্যগুলির ম্যানুয়াল ডিজাইনটি প্রাথমিকভাবে পূর্বের জ্ঞানের উপর নির্ভর করে এবং নকশা করা বৈশিষ্ট্যগুলি প্রায়শই অগভীর স্তরে থাকে (যেমন, কোনও গ্রাউন্ড অবজেক্টের প্রান্ত বা স্থানীয় টেক্সচার) এবং তারা চিত্রের মধ্যে থাকা অবজেক্টগুলির জটিল পরিবর্তনগুলি বর্ণনা করতে পারে না। দ্বিতীয়ত, মেশিন লার্নিং মডেল (উদাঃ, এসভিএম), যা শ্রেণিবদ্ধকরণে ব্যবহৃত হয়, অগভীর কাঠামোর মডেল (কর্টেস এবং ভ্যাপনিক, ১৯৯৫) এবং দুর্বল মডেলিং ক্ষমতা রয়েছে এবং তারা প্রায়শই উচ্চতররৈখিক সম্পর্কগুলি পর্যাপ্ত পরিমাণে শিখতে অক্ষম হন।



























  • 0 comments:

    Post a Comment

    New Research

    Attention Mechanism Based Multi Feature Fusion Forest for Hyperspectral Image Classification.

    CBS-GAN: A Band Selection Based Generative Adversarial Net for Hyperspectral Sample Generation.

    Multi-feature Fusion based Deep Forest for Hyperspectral Image Classification.

    ADDRESS

    388 Lumo Rd, Hongshan, Wuhan, Hubei, China

    EMAIL

    contact-m.zamanb@yahoo.com
    mostofa.zaman@cug.edu.cn

    TELEPHONE

    #
    #

    MOBILE

    +8615527370302,
    +8807171546477