রি-ইনফোর্সমেন্ট লার্নিং এর উপাদান সমূহ

এজেন্ট (Agent) এবং পরিবেশ (Environment) ছাড়াও চারটি উপ-উপাদান (Sub-element) রয়েছে। সেগুলো হচ্ছে – পলিসি (Policy), রি-ওয়ার্ড (Reward), ভাল্যু ফাংশন (Value Function), এবং মডেল (Model)। পলিসি (Policy) পলিসি একটি নির্দিষ্ট পরিবেশে কোন এজেন্ট এর আচরণ কেমন হবে সেটা...

এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation)

এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation) পদ্ধতি দুইটি রি-ইনফোর্সমেন্ট লার্নিং এর অন্যতম মৌলিক প্রক্রিয়া। এক কথায় বলতে গেলে এক্সপ্লোরেশনের মাধ্যমে নতুন কিছু শেখে এবং এক্সপ্লয়টেশনের মাধ্যমে জ্ঞাত বিষয়গুলোর আলোকে সিদ্ধান্ত গ্রহণ করে। এই দুইটার মধ্যে...

রিইনফোর্সমেন্ট লার্নিং কি?

রি-ইনফোর্সমেন্ট লার্নিং এক ধরনের শেখার (Learning) প্রক্রিয়া যেটার উদ্দেশ্য হচ্ছে কোন একটা পরিবেশে এমন একটা সিদ্ধান্ত গ্রহণ করা যেখান থেকে সর্বোচ্চ পরিমাণ রি-ওয়ার্ড(reward) পাওয়া যাবে। এটা একটি ট্রায়াল-এন্ড-এরর (trial-and-error) পদ্ধতি। ট্রায়াল-এন্ড-এরর এবং...