রি-ইনফোর্সমেন্ট লার্নিং এর উপাদান সমূহ

এজেন্ট (Agent) এবং পরিবেশ (Environment) ছাড়াও চারটি উপ-উপাদান (Sub-element) রয়েছে। সেগুলো হচ্ছে – পলিসি (Policy), রি-ওয়ার্ড (Reward), ভাল্যু ফাংশন (Value Function), এবং মডেল (Model)। পলিসি (Policy) পলিসি একটি নির্দিষ্ট পরিবেশে কোন এজেন্ট এর আচরণ কেমন হবে সেটা...

রিইনফোর্সমেন্ট লার্নিং কি?

রি-ইনফোর্সমেন্ট লার্নিং এক ধরনের শেখার (Learning) প্রক্রিয়া যেটার উদ্দেশ্য হচ্ছে কোন একটা পরিবেশে এমন একটা সিদ্ধান্ত গ্রহণ করা যেখান থেকে সর্বোচ্চ পরিমাণ রি-ওয়ার্ড(reward) পাওয়া যাবে। এটা একটি ট্রায়াল-এন্ড-এরর (trial-and-error) পদ্ধতি। ট্রায়াল-এন্ড-এরর এবং...
ঝামেলা ছাড়াই GPU সহ Tensorflow এবং PyTorch ইনস্টল

ঝামেলা ছাড়াই GPU সহ Tensorflow এবং PyTorch ইনস্টল

অনেকদিন ধরে ডিপ লার্নিং এর সাথে থাকার কারণে বিভিন্ন রকম প্যাকেজ বা থার্ড পার্টি সফটওয়্যার ইনস্টল করার প্রয়োজন পড়ে। কিন্তু GPU তে কাজ করতে গেলে মাঝে মাঝেই অনেক সমস্যায় পড়তে হয়। মূলত সমস্যা হয় ভার্শন নিয়ে। এজন্যই ভাবলাম যে একটা নোট লিখে ফেলি। অবশ্য আমি Anaconda ব্যবহার...