by Shahinur | অক্টো. 18, 2019 | মেশিন লার্নিং, রি-ইনফোর্সমেন্ট লার্নিং
এজেন্ট (Agent) এবং পরিবেশ (Environment) ছাড়াও চারটি উপ-উপাদান (Sub-element) রয়েছে। সেগুলো হচ্ছে – পলিসি (Policy), রি-ওয়ার্ড (Reward), ভাল্যু ফাংশন (Value Function), এবং মডেল (Model)। পলিসি (Policy) পলিসি একটি নির্দিষ্ট পরিবেশে কোন এজেন্ট এর আচরণ কেমন হবে সেটা...
by Shahinur | অক্টো. 13, 2019 | রি-ইনফোর্সমেন্ট লার্নিং
রি-ইনফোর্সমেন্ট লার্নিং এক ধরনের শেখার (Learning) প্রক্রিয়া যেটার উদ্দেশ্য হচ্ছে কোন একটা পরিবেশে এমন একটা সিদ্ধান্ত গ্রহণ করা যেখান থেকে সর্বোচ্চ পরিমাণ রি-ওয়ার্ড(reward) পাওয়া যাবে। এটা একটি ট্রায়াল-এন্ড-এরর (trial-and-error) পদ্ধতি। ট্রায়াল-এন্ড-এরর এবং...
by Shahinur | সেপ্টে. 2, 2019 | ডিপ লার্নিং, মেশিন লার্নিং
অনেকদিন ধরে ডিপ লার্নিং এর সাথে থাকার কারণে বিভিন্ন রকম প্যাকেজ বা থার্ড পার্টি সফটওয়্যার ইনস্টল করার প্রয়োজন পড়ে। কিন্তু GPU তে কাজ করতে গেলে মাঝে মাঝেই অনেক সমস্যায় পড়তে হয়। মূলত সমস্যা হয় ভার্শন নিয়ে। এজন্যই ভাবলাম যে একটা নোট লিখে ফেলি। অবশ্য আমি Anaconda ব্যবহার...
সাম্প্রতিক মন্তব্যসমূহ