PSNR কি?

Peak Signal to Noise Ratio এর সংক্ষিপ্ত রুপই PSNR. PSNR এর মাধ্যমেই দুইটি ছবি বা সিগন্যালের সামঞ্জস্যতা বা বৈসাদৃশ্য নিরুপন করা হয়। এই লেখাটি এখনো অনুবাদ করা হয়নি। ইংরেজীতে দেখতে এখানে ক্লিক...

রি-ইনফোর্সমেন্ট লার্নিং এর উপাদান সমূহ

এজেন্ট (Agent) এবং পরিবেশ (Environment) ছাড়াও চারটি উপ-উপাদান (Sub-element) রয়েছে। সেগুলো হচ্ছে – পলিসি (Policy), রি-ওয়ার্ড (Reward), ভাল্যু ফাংশন (Value Function), এবং মডেল (Model)। পলিসি (Policy) পলিসি একটি নির্দিষ্ট পরিবেশে কোন এজেন্ট এর আচরণ কেমন হবে সেটা...

এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation)

এক্সপ্লোরেশন (Exploration) এবং এক্সপ্লয়টেশন (Exploitation) পদ্ধতি দুইটি রি-ইনফোর্সমেন্ট লার্নিং এর অন্যতম মৌলিক প্রক্রিয়া। এক কথায় বলতে গেলে এক্সপ্লোরেশনের মাধ্যমে নতুন কিছু শেখে এবং এক্সপ্লয়টেশনের মাধ্যমে জ্ঞাত বিষয়গুলোর আলোকে সিদ্ধান্ত গ্রহণ করে। এই দুইটার মধ্যে...

রিইনফোর্সমেন্ট লার্নিং কি?

রি-ইনফোর্সমেন্ট লার্নিং এক ধরনের শেখার (Learning) প্রক্রিয়া যেটার উদ্দেশ্য হচ্ছে কোন একটা পরিবেশে এমন একটা সিদ্ধান্ত গ্রহণ করা যেখান থেকে সর্বোচ্চ পরিমাণ রি-ওয়ার্ড(reward) পাওয়া যাবে। এটা একটি ট্রায়াল-এন্ড-এরর (trial-and-error) পদ্ধতি। ট্রায়াল-এন্ড-এরর এবং...

মানবিকতা নাকি পাশবিকতা?

আমি সবসময় সবাইকে মানবিক হতে বলি। ব্যক্তিগতভাবে আমি মনে করি, একজন মানুষের গন্তব্য হওয়া উচিত মানবিকতা ও নৈতিকতার সর্বোচ্চ পর্যায়; যদিও মানবিকতা বা নৈতিকতা একটু আপেক্ষিক বিষয়। মানুষ এই গ্রহের সবচেয়ে বুদ্ধিমান প্রাণি, তার আচরণ ও ব্যবহারও হওয়া উচিৎ সকল প্রাণি থেকে আলাদা;...