কোনও বুদ্ধিমান ভিডিও নজরদারি সিস্টেমের মধ্যে পথচারী সনাক্তকরণ একটি অপরিহার্য এবং উল্লেখযোগ্য কাজ , কারণ এটি ভিডিও ফুটেজগুলিরসেমিটিক বোঝার জন্য মৌলিক তথ্য সরবরাহ করে । এটি নিরাপত্তা সিস্টেম উন্নতির জন্য সম্ভাব্য কারণে স্বয়ংচালিত অ্যাপ্লিকেশন একটি সুস্পষ্ট এক্সটেনশান আছে। অনেক Car নির্মাতারা (eg Volvo, Ford, GM, Nissan) এটি 2017 সালে ADAS বিকল্প হিসাবে প্রস্তাব করে ।

Pedestrian detection
চ্যালেঞ্জ/Challenges
- চেহারা বিভিন্ন পোশাক শৈলী Various style of clothing in appearance
- বিভিন্ন সম্ভাব্য articulations Different possible articulations
- আনুষাঙ্গিক আনুষাঙ্গিক উপস্থিতি The presence of occluding accessories
- পথচারীদের মধ্যে ঘন ঘন বিভ্রমFrequent occlusion between pedestrians
Existing approaches/বিদ্যমান পন্থা
চ্যালেঞ্জ সত্ত্বেও, সাম্প্রতিক বছরগুলিতে পথচারী সনাক্তকরণ এখনও কম্পিউটার দৃষ্টিভঙ্গিতে একটি সক্রিয় গবেষণা এলাকা অবশেষ। অনেক পন্থা প্রস্তাব করা হয়েছে।
Holistic detection/হোলিস্টিক সনাক্তকরণ
ডিটেক্টরকে পুরো ফ্রেম স্ক্যান করে ভিডিও ফ্রেমে পথচারীদের সন্ধান করার প্রশিক্ষণ দেওয়া হয়। যদি স্থানীয় অনুসন্ধান উইন্ডোতে চিত্র বৈশিষ্ট্যগুলি নির্দিষ্ট মানদণ্ড পূরণ করে তবে আবিষ্কারক "সফল"। কিছু পদ্ধতি প্রান্ত টেমপ্লেট যেমন বিশ্বব্যাপী বৈশিষ্ট্যগুলি নিযুক্ত করে,অন্যরা স্থানীয় বৈশিষ্ট্যগুলি যেমন ভিত্তিক গ্র্যাডেন্টগুলির হিস্টোগ্রাম বর্ণনাকারী ব্যবহার করে। এই পদ্ধতির ত্রুটিটি হল পটভূমির ঘাটতি এবং ঘটনাগুলি দ্বারা কার্যকারিতাটি সহজেই প্রভাবিত হতে পারে।

পথচারী সনাক্তকরণ
Part-based detection/পার্ট ভিত্তিক সনাক্তকরণ/
পথচারীদের অংশ সংগ্রহ হিসাবে মডেল করা হয়। পার্ট হাইপোথিসেসগুলি প্রথমে স্থানীয় বৈশিষ্ট্য শেখার মাধ্যমে তৈরি করা হয়, যার মধ্যে অ্যাঞ্জেললেট এবং অভিযোজন বৈশিষ্ট্য রয়েছে। এই অংশ অনুমান তারপর বিদ্যমান পথচারী অনুমান সেরা সমাবেশ গঠন যোগদান করা হয়। এই পদ্ধতির আকর্ষণীয় যদিও, অংশ সনাক্তকরণ নিজেই একটি কঠিন কাজ। এই পদ্ধতির বাস্তবায়ন চিত্র তথ্য প্রক্রিয়াকরণের জন্য একটি প্রমিত পদ্ধতি অনুসরণ করে যা প্রথমটি একটি ঘন নমুনা চিত্র পিরামিড তৈরি করে, প্রতিটি স্কেলে কম্পিউটিং বৈশিষ্ট্যগুলি, সম্ভাব্য সমস্ত স্থানে শ্রেণীবদ্ধকরণ সম্পাদন করে এবং চূড়ান্ত সেট তৈরি করতে সর্বদা সর্বাধিক সর্পিল সম্পাদন করে আবদ্ধ বাক্স।
Patch-based detection/ প্যাচ(কাটছাঁট) ভিত্তিক সনাক্তকরণ
সম্প্রতিLeibe et al Implicit Shape Model (ISM) নামের সাথে সনাক্তকরণ এবং বিভাজন উভয়কে সমন্বিত করে একটি পদ্ধতির প্রস্তাব করা হয়েছে। স্থানীয় উপস্থিতি একটি codebook প্রশিক্ষণ প্রক্রিয়ার সময় শিখেছি। সনাক্তকরণ প্রক্রিয়ার মধ্যে, স্থানীয় বৈশিষ্ট্যগুলি codebook এন্ট্রিগুলির সাথে মেলে ধরতে ব্যবহৃত হয় এবং প্রতিটি মিল পথচারী অনুমানগুলির জন্য এক ভোট ধারণ করে। চূড়ান্ত সনাক্তকরণের ফলাফলগুলি সেই অনুমানগুলিকে আরও পরিমার্জিত করে তুলতে পারে। এই পদ্ধতির সুবিধা শুধুমাত্র প্রশিক্ষণ ইমেজ একটি ছোট সংখ্যা প্রয়োজন হয়।
যখন শর্ত অনুমতি দেয় (fixed camera, stationary lighting conditions, etc.) ।background subtraction (বাদে) পথচারীদের সনাক্ত করতে সাহায্য করতে পারেন। পটভূমি বাদে ভিডিও পটভূমির পিক্সেলকে পটভূমি হিসাবে শ্রেণিবদ্ধ করে, যেখানে কোনো detected, or foreground,সনাক্ত করা হয় না,এই পদ্ধতিটি সহ দৃশ্যমান প্রতিটি দৃশ্যমান উপাদানগুলির সিলুয়েটগুলি (সম্মুখভাগে সংযুক্ত উপাদান) হাইলাইট করে। মানুষের সনাক্ত করার জন্য এই সিলুয়েটগুলির আকার বিশ্লেষণ করার জন্য university of Liège,একটি অ্যালগরিদম তৈরি করা হয়েছে।যেহেতু সম্পূর্ণভাবে সিলুয়েট বিবেচনা করা এবং একক শ্রেণিবদ্ধকরণ পদ্ধতিগুলি, সাধারণভাবে, আকৃতির আকৃতির জন্য অত্যন্ত সংবেদনশীল, ছোট অংশগুলির একটি সেটের মধ্যে সিলুয়েটগুলি ভাগ করা একটি অংশ-ভিত্তিক পদ্ধতি ত্রুটিযুক্ত প্রভাব হ্রাস করার প্রস্তাব দেওয়া হয়েছে।অন্যান্য অংশ ভিত্তিক পদ্ধতির বিপরীতে, এই অঞ্চলের কোনো শারীরবৃত্তীয় অর্থ নেই। এই অ্যালগরিদমটি 3D ভিডিও স্ট্রিমগুলিতে মানুষের সনাক্তকরণে বাড়ানো হয়েছে।
Fleuret et al একাধিক পথচারীদের সনাক্ত করার জন্য একাধিক calibrated ক্যামেরা সংহত করার জন্য একটি পদ্ধতি প্রস্তাবিত। এই পদ্ধতিতে, স্থল সমতলটি ইউনিফর্ম, অ-ওভারল্যাপিং গ্রিড কোষে বিভক্ত, সাধারণত ২5 দ্বারা 25 (সেমি) আকারে।আবিষ্কারক একটি সম্ভাব্যতা আকৃষ্ট মানচিত্র Probability Occupancy Map (POM), (POM) তৈরি করে, এটি প্রতিটি ব্যক্তির গ্রিড সেলের সম্ভাব্যতার একটি অনুমান সরবরাহ করে। চোখের স্তরে এবং বিভিন্ন কোণ থেকে নেওয়া দুটি থেকে চারটি সিঙ্ক্রোনাইজড ভিডিও স্ট্রিম দেওয়া হয়েছে, এই পদ্ধতিটি কার্যকরী অনুষ্ঠান এবং আলোচনার পরিবর্তে হাজার হাজার ফ্রেম জুড়ে ছয় ব্যক্তির সঠিকভাবে অনুসরণ করার জন্য গতিশীল প্রোগ্রামিং সহ একটি জেনারেটিক মডেলকে একত্রিত করতে পারে।চোখের স্তরে এবং বিভিন্ন কোণ থেকে নেওয়া দুটি থেকে চারটি সিঙ্ক্রোনাইজড ভিডিও স্ট্রিম দেওয়া হয়েছে, এই পদ্ধতিটি কার্যকরী অনুষ্ঠান এবং আলোচনার পরিবর্তে হাজার হাজার ফ্রেম জুড়ে ছয় ব্যক্তির সঠিকভাবে অনুসরণ করার জন্য গতিশীল প্রোগ্রামিং সহ একটি জেনারেটিক মডেলকে একত্রিত করতে পারে। এটি তাদের প্রতিটি জন্য metrically সঠিক trajectories অর্জন করতে পারেন।
Related seminal work / সম্পর্কিত মৌলিক কাজ
- Histogram of oriented gradientsভিত্তিক gradients এর হিস্টোগ্রাম
- Integral channel featurঅবিচ্ছেদ্য চ্যানেল featur
References
- ^ C. Papageorgiou and T. Poggio, "A Trainable Pedestrian Detection system", International Journal of Computer Vision (IJCV), pages 1:15–33, 2000
- ^ N. Dalal, B. Triggs, “Histograms of oriented gradients for human detection”, IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), pages 1:886–893, 2005
- ^ Bo Wu and Ram Nevatia, "Detection of Multiple, Partially Occluded Humans in a Single Image by Bayesian Combination of Edgelet Part Detectors", IEEE International Conference on Computer Vision (ICCV), pages 1:90–97, 2005
- ^ Mikolajczyk, K. and Schmid, C. and Zisserman, A. "Human detection based on a probabilistic assembly of robust part detectors", The European Conference on Computer Vision (ECCV), volume 3021/2004, pages 69–82, 2005
- ^ Hyunggi Cho, Paul E. Rybski, Aharon Bar-Hillel and Wende Zhang "Real-time Pedestrian Detection with Deformable Part Models"
- ^ B.Leibe, E. Seemann, and B. Schiele. "Pedestrian detection in crowded scenes" IEEE Conference on Computer Vision and Pattern Recognition(CVPR), pages 1:878–885, 2005
- ^ O. Barnich, S. Jodogne, and M. Van Droogenbroeck. "Robust analysis of silhouettes by morphological size distributions" Advanced Concepts for Intelligent Vision Systems(ACIVS), pages 734–745, 2006
- ^ S. Piérard, A. Lejeune, and M. Van Droogenbroeck. "A probabilistic pixel-based approach to detect humans in video streams" IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), pages 921–924, 2011
- ^ S. Piérard, A. Lejeune, and M. Van Droogenbroeck. "3D information is valuable for the detection of humans in video streams" Proceedings of 3D Stereo MEDIA, pages 1–4, 2010
- ^ F. Fleuret, J. Berclaz, R. Lengagne and P. Fua, Multi-Camera People Tracking with a Probabilistic Occupancy Map, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, Nr. 2, pp. 267–282, February 2008.
0 comments:
Post a Comment