Press ESC to close

SHAHINUR

Researcher | Thinker | Writer & Blogger

মাল্টি-আর্মড ব্যান্ডিট (Multi-armed Bandit)

মাল্টি-আর্মড ব্যান্ডিট (Multi-armed Bandit) ক্লাসিক্যাল রি-ইনফোর্সমেন্ট লার্নিং সমস্যাগুলোর মধ্যে অন্যতম। মূলত এটি একটি স্লট মেশিন (Slot Machine)…

রি-ইনফোর্সমেন্ট লার্নিং এর উপাদান সমূহ

এজেন্ট (Agent) এবং পরিবেশ (Environment) ছাড়াও চারটি উপ-উপাদান (Sub-element) রয়েছে। সেগুলো হচ্ছে – পলিসি (Policy), রি-ওয়ার্ড (Reward),…

এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation)

এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation) পদ্ধতি দুইটি রি-ইনফোর্সমেন্ট লার্নিং এর অন্যতম মৌলিক প্রক্রিয়া। এক কথায় বলতে গেলে…

রিইনফোর্সমেন্ট লার্নিং কি?

রি-ইনফোর্সমেন্ট লার্নিং এক ধরনের শেখার (Learning) প্রক্রিয়া যেটার উদ্দেশ্য হচ্ছে কোন একটা পরিবেশে এমন একটা সিদ্ধান্ত গ্রহণ…

Matplotlib ব্যবহার করে পাইথনে লাইন অথবা গ্রাফ তৈরি করা

কোন ডাটাকে ভালভাবে বোঝার জন্য এর ভিজ্যুয়ালাইজেশন খুবই গুরুত্বপূর্ণ। মেশিন লার্নিং বা ডিপ লার্নিং এর ক্ষেত্রে যেকোন…