by Shahinur | অক্টো. 18, 2019 | মেশিন লার্নিং, রি-ইনফোর্সমেন্ট লার্নিং
এজেন্ট (Agent) এবং পরিবেশ (Environment) ছাড়াও চারটি উপ-উপাদান (Sub-element) রয়েছে। সেগুলো হচ্ছে – পলিসি (Policy), রি-ওয়ার্ড (Reward), ভাল্যু ফাংশন (Value Function), এবং মডেল (Model)। পলিসি (Policy) পলিসি একটি নির্দিষ্ট পরিবেশে কোন এজেন্ট এর আচরণ কেমন হবে সেটা...
by Shahinur | অক্টো. 17, 2019 | রি-ইনফোর্সমেন্ট লার্নিং
এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation) পদ্ধতি দুইটি রি-ইনফোর্সমেন্ট লার্নিং এর অন্যতম মৌলিক প্রক্রিয়া। এক কথায় বলতে গেলে এক্সপ্লোরেশনের মাধ্যমে নতুন কিছু শেখে এবং এক্সপ্লয়টেশনের মাধ্যমে জ্ঞাত বিষয়গুলোর আলোকে সিদ্ধান্ত গ্রহণ করে। এই দুইটার মধ্যে...
by Shahinur | অক্টো. 13, 2019 | রি-ইনফোর্সমেন্ট লার্নিং
রি-ইনফোর্সমেন্ট লার্নিং এক ধরনের শেখার (Learning) প্রক্রিয়া যেটার উদ্দেশ্য হচ্ছে কোন একটা পরিবেশে এমন একটা সিদ্ধান্ত গ্রহণ করা যেখান থেকে সর্বোচ্চ পরিমাণ রি-ওয়ার্ড(reward) পাওয়া যাবে। এটা একটি ট্রায়াল-এন্ড-এরর (trial-and-error) পদ্ধতি। ট্রায়াল-এন্ড-এরর এবং...
সাম্প্রতিক মন্তব্যসমূহ