PSNR কি?

PSNR কি?

Peak Signal to Noise Ratio এর সংক্ষিপ্ত রুপই PSNR. PSNR এর মাধ্যমেই দুইটি ছবি বা সিগন্যালের সামঞ্জস্যতা বা বৈসাদৃশ্য নিরুপন করা হয়। এই লেখাটি এখনো অনুবাদ করা হয়নি। ইংরেজীতে দেখতে এখানে ক্লিক...
রি-ইনফোর্সমেন্ট লার্নিং এর উপাদান সমূহ

রি-ইনফোর্সমেন্ট লার্নিং এর উপাদান সমূহ

এজেন্ট (Agent) এবং পরিবেশ (Environment) ছাড়াও চারটি উপ-উপাদান (Sub-element) রয়েছে। সেগুলো হচ্ছে – পলিসি (Policy), রি-ওয়ার্ড (Reward), ভাল্যু ফাংশন (Value Function), এবং মডেল (Model)। পলিসি (Policy) পলিসি একটি নির্দিষ্ট পরিবেশে কোন এজেন্ট এর আচরণ কেমন হবে সেটা...
এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation)

এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation)

এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation) পদ্ধতি দুইটি রি-ইনফোর্সমেন্ট লার্নিং এর অন্যতম মৌলিক প্রক্রিয়া। এক কথায় বলতে গেলে এক্সপ্লোরেশনের মাধ্যমে নতুন কিছু শেখে এবং এক্সপ্লয়টেশনের মাধ্যমে জ্ঞাত বিষয়গুলোর আলোকে সিদ্ধান্ত গ্রহণ করে। এই দুইটার মধ্যে...
রিইনফোর্সমেন্ট লার্নিং কি?

রিইনফোর্সমেন্ট লার্নিং কি?

রি-ইনফোর্সমেন্ট লার্নিং এক ধরনের শেখার (Learning) প্রক্রিয়া যেটার উদ্দেশ্য হচ্ছে কোন একটা পরিবেশে এমন একটা সিদ্ধান্ত গ্রহণ করা যেখান থেকে সর্বোচ্চ পরিমাণ রি-ওয়ার্ড(reward) পাওয়া যাবে। এটা একটি ট্রায়াল-এন্ড-এরর (trial-and-error) পদ্ধতি। ট্রায়াল-এন্ড-এরর এবং...