deep learning উপর ভিত্তি করে মানব পজিশনের অনুমানে ব্যবহৃত বিভিন্ন কৌশলগুলির ভূমিকা

মানুষের দৃষ্টি অনুমান কম্পিউটার দৃষ্টিভঙ্গি প্রধান গবেষণা এলাকায় এর গুরুত্বের কারণ হল অ্যাপ্লিকেশনগুলির প্রাচুর্য যা এমন প্রযুক্তি থেকে উপকৃত হতে পারে। এখানে গভীর শিক্ষার উপর ভিত্তি করে মানব পজিশনের অনুমানে ব্যবহৃত বিভিন্ন কৌশলগুলির ভূমিকা রয়েছে।

দ্বারা Bharath রাজ , সহযোগী প্রকৌশলী, এবং Yoni Osin , BeyondMinds এ R & D- ভিপি

একটি হিউম্যান পোজ স্কেল্টন একটি গ্রাফিকাল বিন্যাসে একজন ব্যক্তির অভিযোজন প্রতিনিধিত্ব করে। মূলত, এটি সমন্বয়গুলির একটি সেট যা ব্যক্তিটির অবস্থান বর্ণনা করার সাথে যুক্ত হতে পারে। কঙ্কাল প্রতিটি সমন্বয় একটি অংশ (অথবা একটি যৌথ, বা একটি keypoint) হিসাবে পরিচিত হয়। দুটি অংশের মধ্যে একটি বৈধ সংযোগ একটি জোড়া (বা একটি অঙ্গবিন্যাস) হিসাবে পরিচিত হয়। উল্লেখ্য, সব অংশ সমন্বয় বৈধ জোড়া বৃদ্ধি দেয় না। একটি নমুনা মানুষের মাথা কঙ্কাল নীচে দেখানো হয়।

মানুষের জন্য COCO keypoint বিন্যাস skeleton পোজ

Left: COCO keypoint format for human pose skeletons. Right: Rendered human pose skeletons. (Source)

বাম: মানুষের জন্য COCO keypoint বিন্যাস skeletons পোজ। রাইট: রেন্ডার্ড মানব skeleton pose। (সূত্র)

একজন ব্যক্তির অভিযোজন জানাতে বিভিন্ন বাস্তব জীবনের অ্যাপ্লিকেশনের জন্য পথ খোলা হয়, যার মধ্যে কিছু এই ব্লগের শেষ দিকে আলোচনা করা হয়। হিউম্যান পোজ আনুমানিক কয়েকটি পদ্ধতির মধ্যে বছর ধরে চালু করা হয়। প্রাথমিকতম (এবং ধীর গতির) পদ্ধতিগুলি সাধারণত এমন একটি চিত্রের একক ব্যক্তির অবস্থানের অনুমান করে যা কেবলমাত্র একজন ব্যক্তির সাথে শুরু হতে পারে। এই পদ্ধতিগুলি প্রথমত পৃথক অংশগুলি সনাক্ত করে, পরে তাদের তৈরি করার জন্য সংযোগ তৈরি করে।

স্বাভাবিকভাবেই, এই পদ্ধতিগুলি অনেক বাস্তব জীবনে দৃশ্যমান নয় যেখানে চিত্রগুলি একাধিক ব্যক্তি ধারণ করে।

Multi-Person Pose Estimation মাল্টি ব্যক্তি অনুমান করা

মাল্টি-পার্সন পোজ অ্যানিমেশনটি একক ব্যক্তির ক্ষেত্রে তুলনায় আরো কঠিন, কারণ একটি চিত্রের অবস্থান এবং লোকেদের সংখ্যা অজানা। সাধারণত, আমরা দুটি পদ্ধতির মধ্যে একটি ব্যবহার করে উপরের সমস্যাটি মোকাবেলা করতে পারি:

সহজ পদ্ধতিটি একটি ব্যক্তি আবিষ্কারককে প্রথমে অন্তর্ভুক্ত করা, পরে অংশগুলি অনুমান করে এবং তারপরে প্রতিটি ব্যক্তির জন্য পজিশন গণনা করা হয়। এই পদ্ধতিটি শীর্ষ-ডাউন পদ্ধতির হিসাবে পরিচিত ।
আরেকটি পদ্ধতি হল চিত্রের প্রতিটি অংশের (অর্থাৎ প্রতিটি ব্যক্তির অংশ) সনাক্ত করা, অনুসরণ করে স্বতন্ত্র ব্যক্তিদের অংশীদারি / দলবদ্ধকরণ। এই পদ্ধতি নীচে আপ পদ্ধতির হিসাবে পরিচিত হয় ।

শীর্ষ: বৈশিষ্টসূচক শীর্ষ-ডাউন পদ্ধতির। নিচের: সাধারণত নীচে আপ পদ্ধতি। ( চিত্র উত্স )

সাধারণত, শীর্ষ-নীচের পদ্ধতিটি নীচে-ভিত্তিক পদ্ধতির চেয়ে বাস্তবায়ন করা সহজ, যেমন একজন ব্যক্তি ডিটেক্টর যোগদানকারী / গোষ্ঠী অ্যালগরিদম যোগ করার চেয়ে অনেক সহজ। ডিটেক্টর এবং অ্যাসোসিয়েটিং / গোষ্ঠী অ্যালগরিদমগুলির মধ্যে কোনটি ভাল, তা আসলেই কমিয়ে আনা হয়, যা কোন পদ্ধতির সামগ্রিকতর ভাল কর্মক্ষমতা আছে তা বিচার করা কঠিন।

এই ব্লগে, আমরা গভীর শেখার কৌশলগুলি ব্যবহার করে বহু-ব্যক্তি মানব দোষ অনুমানের উপর মনোযোগ দেব। পরবর্তী বিভাগে, আমরা এর জন্য কয়েকটি জনপ্রিয় শীর্ষ-ডাউন এবং নীচের দিকে দৃষ্টিভঙ্গি পর্যালোচনা করব।

গভীর শিক্ষণ পদ্ধতি

1. ওপেনপোজ

ওপেনপোজ আংশিকভাবে তাদের ভাল নথিভুক্ত GitHub বাস্তবায়নের কারণে মাল্টি-ব্যাক্তিগত মানবিক মূল্যের অনুমানের জন্য সর্বাধিক জনপ্রিয় অবলম্বন পদ্ধতির একটি ।

অনেক নিম্ন-পর্যায়ের পন্থা হিসাবে, ওপেনপোজ প্রথমে ছবির প্রত্যেকটি ব্যক্তির সাথে সম্পর্কযুক্ত অংশগুলি (কী পয়েন্ট) সনাক্ত করে, তারপরে পৃথক ব্যক্তিদের অংশগুলি নির্দিষ্ট করে। নিচে প্রদর্শিত হয় OpenPose মডেলের স্থাপত্য।

OpenPose আর্কিটেকচারের ফ্লোচার্ট। ( উত্স )

ওপেনপোজ নেটওয়ার্কটি প্রথম কয়েকটি স্তর (উপরের ফ্লোরচার্টে VGG-19) ব্যবহার করে একটি চিত্র থেকে বৈশিষ্ট্যগুলি উপরি করে। বৈশিষ্ট্য তারপর সংশ্লেষ স্তর দুটি সমান্তরাল শাখা মধ্যে খাওয়ানো হয়। প্রথম শাখাটি 18 টি আস্থা মানচিত্রের একটি সেট ভবিষ্যদ্বাণী করে, প্রতিটি মানচিত্র মানব দেহের কঙ্কালের একটি নির্দিষ্ট অংশকে প্রতিনিধিত্ব করে। দ্বিতীয় শাখা 38 অংশ অ্যাফিনিটি ফিল্ডস (PAFs) এর একটি সেট ভবিষ্যদ্বাণী করে যা অংশগুলির মধ্যে সংঘর্ষের ডিগ্রীকে প্রতিনিধিত্ব করে।

ওপেনপোজ ব্যবহার করে মানব পজিশনের মূল্যায়নের পদক্ষেপ। ( উত্স )

ধারাবাহিক পর্যায়ে প্রতিটি শাখা দ্বারা তৈরি পূর্বাভাস পরিমার্জন করা হয়। অংশ আস্থা মানচিত্র ব্যবহার করে, বাইপার্টাইট গ্রাফগুলি অংশগুলির জোড়াগুলির মধ্যে তৈরি হয় (উপরের ছবিতে দেখানো হয়েছে)। PAF মানগুলি ব্যবহার করে, বাইপার্টাইট গ্রাফগুলিতে দুর্বল লিঙ্কগুলি বাদ দেওয়া হয়। উপরের ধাপগুলির মাধ্যমে, মানব পোষাক skeletons আনুমানিক এবং ইমেজ প্রতি ব্যক্তির দেওয়া হতে পারে। অ্যালগরিদমের আরও পুঙ্খানুপুঙ্খ ব্যাখ্যা করার জন্য, আপনি তাদের কাগজ এবং এই ব্লগ পোস্টে উল্লেখ করতে পারেন ।

2. DeepCut

DeepCut মাল্টি-ব্যক্তি মানব দোষ প্রাক্কলন জন্য একটি নীচে আপ পদ্ধতির। লেখক নিম্নলিখিত সমস্যা সংজ্ঞায়িত করে টাস্ক approached:

D শরীরের অংশ প্রার্থীদের একটি সেট উত্পাদন । এই সেট ইমেজ প্রতি ব্যক্তির জন্য শরীরের অংশ সব সম্ভব অবস্থান প্রতিনিধিত্ব করে। শরীরের অংশ প্রার্থীদের উপরের সেট থেকে শরীরের অংশ একটি উপসেট নির্বাচন করুন।
C শরীরের অংশ ক্লাস এক সঙ্গে প্রতিটি নির্বাচিত শরীরের অংশ লেবেল । শরীরের অংশ শ্রেণীগুলি অংশগুলি যেমন "আর্ম", "লেগ", "টর্স" ইত্যাদি প্রতিনিধিত্ব করে।
একই ব্যক্তির অন্তর্গত পার্টিশন শরীরের অংশ।

পদ্ধতির ছবি উপস্থাপনা। ( উত্স )

উপরের সমস্যাগুলি ইন্টিগ্রেশন লিনিয়ার প্রোগ্রামিং (আইএলপি) সমস্যাতে এটি মডেল করে যৌথভাবে সমাধান করা হয়েছে । এটি (x, y, z) নীচের চিত্রগুলিতে বর্ণিত ডোমেনগুলির সাথে বাইনারি র্যান্ডম ভেরিয়েবলের ট্রিপলগুলি বিবেচনা করে মডেল করা হয় ।

বাইনারি র্যান্ডম পরিবর্তনশীল ডোমেইন। ( উত্স )

দুই শরীরের অংশ প্রার্থীদের বিবেচনা করুন d এবং d' শরীরের অংশ প্রার্থীর সেট থেকে D এবং ক্লাস c এবং c' ক্লাস সেট থেকে C। শরীরের অংশ প্রার্থীদের একটি দ্রুত RCNN বা একটি ঘন সিএনএন মাধ্যমে প্রাপ্ত করা হয় । এখন, আমরা বিবৃতি নিম্নলিখিত সেট বিকাশ করতে পারেন।

x(d,c) = 1 তারপর যদি শরীরের অংশ প্রার্থী d শ্রেণীর অন্তর্গত মানে c।
এছাড়াও, y(d,d') = 1 শরীরের অংশ প্রার্থী d এবং d'একই ব্যক্তির অন্তর্গত নির্দেশ করে।
তারা সংজ্ঞায়িত z(d,d’,c,c’) = x(d,c) * x(d’,c’) * y(d,d’)। যদি উপরের মানটি 1 হয় তবে তার মানে শরীরের অংশীদার প্রার্থী d শ্রেণীভুক্ত c, শরীরের অংশীদার প্রার্থী d' শ্রেণীভুক্ত c', এবং অবশেষে শরীরের অংশ প্রার্থী d,d’ একই ব্যক্তির অন্তর্গত।

শেষ বিবৃতি ব্যবহার করা যেতে পারে বিভিন্ন দলের অন্তর্গত পার্টিশন। স্পষ্টত, উপরের বিবৃতি লাইনার সমীকরণ হিসাবে ফাংশন হিসাবে প্রণয়ন করা যেতে পারে (x,y,z)। এইভাবে, ইন্টিগ্রেশন লিনিয়ার প্রোগ্রাম (আইএলপি) স্থাপন করা হয়, এবং একাধিক ব্যক্তির পজিশন অনুমান করা যেতে পারে। সমীকরণের সঠিক সেট এবং আরও বিশদ বিশ্লেষণের জন্য, আপনি এখানে তাদের কাগজটি পরীক্ষা করতে পারেন ।

3. আরএমপিই (আলফাপোজ)

আরএমইপি পজ অনুমানের একটি জনপ্রিয় শীর্ষ-ডাউন পদ্ধতি। লেখক মনে করেন যে শীর্ষ-ডাউন পদ্ধতিগুলি সাধারণত ব্যক্তি আবিষ্কারকের নির্ভুলতার উপর নির্ভরশীল, কারণ অঞ্চলের অবস্থান যেখানে অঞ্চলের অবস্থান নির্ধারণ করা হয়। অতএব, স্থানীয়করণ এবং সদৃশ আবদ্ধ বক্স ভবিষ্যদ্বাণী ত্রুটি ত্রুটি উপসর্গ আলগোরিদিম উপ-সর্বোত্তম সম্পাদন করতে পারে।

সদৃশ পূর্বাভাস (বাম) এবং কম আস্থা বাঁধন বাক্সের প্রভাব (ডান)। ( উত্স )

এই সমস্যার সমাধান করার জন্য, লেখকরা একটি ত্রুটিযুক্ত সীমানা বাক্স থেকে উচ্চ মানের একক ব্যক্তি অঞ্চলটি বের করার জন্য সিমমেট্রিক স্প্যাটিয়াল ট্রান্সফরমার নেটওয়ার্ক (এসএসটিএন) ব্যবহার করার প্রস্তাব দিয়েছেন। সেই ব্যক্তির জন্য মানব দেহের কঙ্কালটির অনুমান করার জন্য এই নিষ্কাশিত অঞ্চলে A Single Person Pose Estimator (SPPE) ব্যবহার করা হয়। একটি স্পটিয়াল ডি-ট্রান্সফরমার নেটওয়ার্ক (এসডিটিএন) ব্যবহার করা হয় আনুমানিক মানব দেহটিকে মূল চিত্র সমন্বয় পদ্ধতিতে ফিরিয়ে আনতে। অবশেষে, একটি প্যারামেটিক পোজ অ-সর্বাধিক সপ্রেশন (এনএমএস) কৌশল অনাদায়ী পস deductions সমস্যা পরিচালনা করার জন্য ব্যবহার করা হয়।

অধিকন্তু, লেখক প্রশিক্ষণ নমুনাগুলিকে উন্নত করার জন্য একটি পজিশন নির্দেশিত প্রস্তাব জেনারেটর উপস্থাপন করেন যা SPPE এবং SSTN নেটওয়ার্কে প্রশিক্ষণের জন্য আরও ভালভাবে সাহায্য করতে পারে। আরএমইপি এর প্রধান বৈশিষ্ট্যটি হল যে এই কৌশলটিকে সনাক্তকরণের জন্য আলগোরিদিম এবং SPPE এর যেকোন সংমিশ্রণে প্রসারিত করা যেতে পারে।

4. মুখোশ আরসিএনএন

মাস্ক আরসিএনএন শব্দার্থিক এবং উদাহরণ বিভাজন সম্পাদনের জন্য একটি জনপ্রিয় স্থাপত্য। মডেলটি সমান্তরালভাবে চিত্রের বিভিন্ন বস্তুর সীমাবদ্ধ অবস্থানের অবস্থান এবং একটি মুখোশ যা ভবিষ্যদ্বাণীগতভাবে বস্তুকে ভাগ করে। মৌলিক আর্কিটেকচার বেশিরভাগ মানুষের পজিশনের জন্য সহজেই বর্ধিত করা যেতে পারে।

Flowchart মাস্ক RCNN আর্কিটেকচার বর্ণনা। ( উত্স )

বেসিক আর্কিটেকচারের প্রথম এক্সট্রাক্টগুলি একটি সিএনএন ব্যবহার করে একটি চিত্র থেকে মানচিত্র বৈশিষ্ট্য করে। বস্তুর উপস্থিতির জন্য বাঁধাকপি বাক্স প্রার্থীদের পেতে এই বৈশিষ্ট্য মানচিত্রগুলি একটি অঞ্চল প্রস্তাব নেটওয়ার্ক (RPN) দ্বারা ব্যবহৃত হয়। সীমাবদ্ধ বাক্স প্রার্থী সিএনএন দ্বারা উদ্ভূত বৈশিষ্ট্য মানচিত্র থেকে একটি এলাকা (অঞ্চল) নির্বাচন করুন। যেহেতু বাঁধাকপি বাক্সগুলি বিভিন্ন মাপের হতে পারে, তাই RoIAlign নামক একটি স্তরটি এক্সট্র্যাক্ট বৈশিষ্ট্যটির আকার হ্রাস করার জন্য ব্যবহার করা হয় যেমন তারা একক আকারের। এখন, এই এক্সট্র্যাক্ট বৈশিষ্ট্যটি সিএনএনগুলির সমান্তরাল শাখায় সীমাবদ্ধ বাক্স এবং সেগমেন্টেশন মাস্কগুলির চূড়ান্ত ভবিষ্যদ্বাণী হিসাবে প্রেরণ করা হয়েছে।

আমাদের বিভাজন সঞ্চালন যে শাখায় ফোকাস যাক। ধরুন আমাদের ইমেজ একটি বস্তু কে ক্লাসের মধ্যে এক হতে পারে। বিভাজন শাখা K আকার বাইনারি মাস্ক আউটপুট m x m, যেখানে প্রতিটি বাইনারি মাস্ক একা সেই ক্লাসের সমস্ত বস্তুর প্রতিনিধিত্ব করে। আমরা প্রত্যেকটি কীপয়েন্টকে একটি স্বতন্ত্র শ্রেণী হিসাবে মডেল করে এবং সেগমেন্টেশনের সমস্যা মত আচরণ করে চিত্রটির প্রতিটি ব্যক্তির সাথে সম্পর্কিত কী পয়েন্টগুলি বের করতে পারি।

সমান্তরালভাবে, আপত্তি সনাক্তকরণ অ্যালগরিদম ব্যক্তিদের অবস্থান সনাক্ত করতে প্রশিক্ষিত করা যেতে পারে। ব্যক্তির অবস্থানের পাশাপাশি কীপয়েন্টগুলির সেটের তথ্য সংযোজন করে, আমরা চিত্রের প্রতিটি ব্যক্তির জন্য মানব দেহের কঙ্কালটি অর্জন করি।

এই পদ্ধতি প্রায় শীর্ষ-ডাউন পদ্ধতির অনুরূপ, কিন্তু ব্যক্তি সনাক্তকরণ পর্যায় অংশ সনাক্তকরণ পর্যায়ে সমান্তরাল সঞ্চালিত হয়। অন্য কথায়, কীপয়েন্ট সনাক্তকরণ স্তর এবং ব্যক্তি সনাক্তকরণ পর্যায় একে অপরের থেকে স্বাধীন।

5. অন্যান্য পদ্ধতি

মাল্টি-পার্সম্যান হিউম্যান পোজ অনুমান সমস্যাটি মোকাবেলা করার পদ্ধতিগুলির সাথে এক বিশাল ক্ষেত্র। সংক্ষিপ্ত জন্য, শুধুমাত্র একটি নির্বাচন কয়েক পন্থা এখানে ব্যাখ্যা করা হয়। পন্থাগুলির আরো একটি সম্পূর্ণ তালিকার জন্য, আপনি নিচের লিঙ্কটি দেখতে পারেন:

অ্যাপ্লিকেশন

আনুমানিক আয়তন অসংখ্য ক্ষেত্রগুলিতে অ্যাপ্লিকেশন আছে, যার মধ্যে কয়েকটি নীচে তালিকাভুক্ত।

1. কার্যকলাপের স্বীকৃতি,

সময়ের সাথে সাথে একজন ব্যক্তির অবস্থানের পার্থক্যগুলি ট্র্যাকিং কার্যকলাপ, অঙ্গভঙ্গি এবং গতি সনাক্তকরণের জন্যও ব্যবহার করা যেতে পারে। এর জন্য অনেকগুলি ব্যবহারের ক্ষেত্রে রয়েছে, সহ:

একটি ব্যক্তি পতিত হয়েছে বা অসুস্থ কিনা তা সনাক্ত করার জন্য অ্যাপ্লিকেশন।
স্বতন্ত্রভাবে সঠিক workout শাসন, খেলাধুলা কৌশল এবং নাচ কার্যক্রম শেখান করতে পারেন যে অ্যাপ্লিকেশন।
সম্পূর্ণ শরীরের সাইন ভাষা বুঝতে পারেন যে অ্যাপ্লিকেশন। (প্রাক্তন: বিমানবন্দর রানওয়ে সংকেত, ট্রাফিক পুলিশ সদস্য, ইত্যাদি)।
নিরাপত্তা এবং নজরদারি উন্নত করতে পারেন যে অ্যাপ্লিকেশন।

ব্যক্তির চলাচলের ট্র্যাকিং নিরাপত্তা এবং নজরদারির উদ্দেশ্যে দরকারী। ( চিত্র উৎস )

2. মোশন ক্যাপচার এবং বর্ধিত বাস্তবতা

মানব সীমা অনুমানের একটি আকর্ষণীয় আবেদন CGI অ্যাপ্লিকেশনগুলির জন্য। গ্রাফিক্স, শৈলী, অভিনব বর্ধিতকরণ, যন্ত্রপাতি এবং শিল্পকর্মটি যদি মানুষের মানসিকতা অনুমান করা যায় তবে সেটির উপর অত্যধিক প্রভাব বিস্তার করা যেতে পারে। এই মানব দেহের বৈচিত্রের উপর নজর রেখে, উপস্থাপিত গ্রাফিক্স ব্যক্তিরা যেভাবে স্থানান্তরিত হয় সেটি "স্বাভাবিকভাবেই ফিট" করতে পারে।

CGI রেন্ডারিং উদাহরণ। ( উত্স )

কি সম্ভব একটি ভাল চাক্ষুষ উদাহরণ অ্যানিমোজি মাধ্যমে দেখা যাবে । যদিও উপরে শুধুমাত্র মুখটির গঠনকে ট্র্যাক করে তবে ধারণাটি একজন ব্যক্তির মূল পয়েন্টগুলির জন্য বহিষ্কৃত করা যেতে পারে। একই ধারণাগুলি আংশিক বাস্তবতা (এআর) উপাদানগুলিকে রেন্ডার করতে পারে যা একটি ব্যক্তির আন্দোলনের অনুকরণ করতে পারে।

3. প্রশিক্ষণ রোবটগুলি

ট্রাজেক্টরির অনুসরণ করতে স্বয়ংক্রিয়ভাবে রোবট প্রোগ্রামিংয়ের পরিবর্তে, একটি কর্ম সঞ্চালনকারী মানব দেহের কঙ্কালের ট্রাজেক্টোরিজিকে অনুসরণ করতে রোবট তৈরি করা যেতে পারে। একটি মানব প্রশিক্ষক কার্যকরভাবে একই প্রদর্শন করে রোবট নির্দিষ্ট কর্ম শেখান করতে পারেন। তারপর রোবট একই কর্ম সঞ্চালনের জন্য তার articulators সরানো কিভাবে গণনা করতে পারেন।

4. কনসোল জন্য গতি ট্র্যাকিং

ইন্টারফেক্টিভ গেমিংয়ের জন্য মানুষের বিষয়গুলির গতির ট্র্যাকিংয়ের জন্য পোজ অনুমানের একটি আকর্ষণীয় আবেদন। জনপ্রিয়ভাবে, Kinect মানব প্লেয়ারের গতি ট্র্যাক করতে এবং ভার্চুয়াল অক্ষরের ক্রিয়াগুলি রেন্ডার করার জন্য এটি ব্যবহার করার জন্য 3D পোজ অনুমান ব্যবহার করে (আইআর সেন্সর ডেটা ব্যবহার করে)।

কর্ম Kinect সেন্সর। ( উত্স )

উপসংহার

মানব পজিশনের প্রাক্কলনের ক্ষেত্রে মহান অগ্রগতি হয়েছে, যা আমাদের সাথে সম্ভাব্য অসাধারণ অ্যাপ্লিকেশনগুলিকে আরও ভালোভাবে পরিবেশন করতে সক্ষম করে। তাছাড়া, পস ট্র্যাকিং সম্পর্কিত সংশ্লিষ্ট ক্ষেত্রগুলিতে গবেষণাটি বেশ কয়েকটি ক্ষেত্রে তার উত্পাদনশীল ব্যবহার ব্যাপকভাবে বাড়িয়ে তুলতে পারে। এই ব্লগে তালিকাভুক্ত ধারণাগুলি সম্পূর্ণ নয় তবে এই অ্যালগরিদমগুলির কিছু জনপ্রিয় রূপ এবং তাদের বাস্তব-জীবন অ্যাপ্লিকেশনগুলি পরিচয় করিয়ে দেওয়ার চেষ্টা করে।

ভারথ রাজ সিমেন্স পিএলএম সফটওয়্যারের সহযোগী প্রকৌশলী। তিনি মেশিন লার্নিং এবং কম্পিউটার দৃষ্টি ধারণা সঙ্গে পরীক্ষা করতে ভালবাসেন। আপনি এখানে তার প্রকল্প চেক আউট করতে পারেন ।

Yoni Osin BeyondMinds এ R & D- ভিপি হয়

মূল । অনুমতি সঙ্গে reposted।

সম্পর্কিত:

Mohammad Mostofa Zaman

deep learning উপর ভিত্তি করে মানব পজিশনের অনুমানে ব্যবহৃত বিভিন্ন কৌশলগুলির ভূমিকা

Multi-Person Pose Estimation মাল্টি ব্যক্তি অনুমান করা

গভীর শিক্ষণ পদ্ধতি

অ্যাপ্লিকেশন

উপসংহার

0 comments:

Post a Comment

Popular Posts

New Research

SAY HELLO TO ME

ADDRESS

EMAIL

TELEPHONE

MOBILE