মাল্টি-আর্মড ব্যান্ডিট (Multi-armed Bandit) ক্লাসিক্যাল রি-ইনফোর্সমেন্ট লার্নিং সমস্যাগুলোর মধ্যে অন্যতম। মূলত এটি একটি স্লট মেশিন (Slot Machine) যেটা ক্যাসিনোতে জুয়ার আসরে বসানো হয়। এই মেশিনের সাথে একটি হাতল থাকে, এই হাতল টানলে সম্ভাব্যতার সূত্রানুসারে দৈবচয়ন পদ্ধতিতে অর্থ বা রি-ওয়ার্ড পাওয়া যায়।

k-আর্মড ব্যান্ডিট (K-armed Bandit)

স্লট মেশিন যদি একটা থাকে তাহলে তাকে ১-আর্মড ব্যান্ডিট (1-armed bandit) বলা হয়। একইভাবে যদি কোথাও একাধিক স্লট মেশিন থাকে তাহলে মাল্টি-আর্মড (Multi-armed) ব্যান্ডিট বা k-আর্মড ব্যান্ডিট বলা হয়। এখানে k হচ্ছে স্লট মেশিনের সংখ্যা।

0 0 votes
Article Rating
0
Would love your thoughts, please comment.x
()
x