কোন ডাটাকে ভালভাবে বোঝার জন্য এর ভিজ্যুয়ালাইজেশন খুবই গুরুত্বপূর্ণ। মেশিন লার্নিং বা ডিপ লার্নিং এর ক্ষেত্রে যেকোন raw ডাটা থেকে কোন সিদ্ধান্তে আসা খুবই জটিল এবং ত্রুটিযুক্ত কাজ।
পাইথনে Matplotlib লাইব্রেরী ব্যবহার করে খুব সহজেই ডাটা ভিজ্যুয়ালাইজেশন বা গ্রাফ/প্লট আঁকা যায়। চলুন দেখা যাক এই কাজটা কিভাবে করা যায় –
আমি ধরে নিচ্ছি আপনার মেশিনে পাইথন এর সাথে Matplotlib লাইব্রেরী টি ইনস্টল করা আছে। প্রথমেই আমাদেরকে লাইব্রেরীটি ইমপোর্ট করতে হবে –
import matplotlib.pyplot as plt
এখন আমাদের কিছু ডাটা দরকার গ্রাফে ডাটাগুলো প্লট করার জন্য। ধরা যাক, আমরা একটা ডিপ লার্নিং সমস্যার জন্য প্লট করতে চাচ্ছি, এবং এই প্লটিং টা হবে বিভিন্ন ব্যাচ সাইজের সাথে accuracy এর সম্পর্ক।
batch_size=[16,32,64,128,512,1024]
accuracy=[96.12,97.38,97.41,95.02,96.22,97.01]
এখানে batch_size এবং accuracy দুইটা ডাটা-পয়েন্ট যেখানে batch_size, x-অক্ষ বরাবর এবং accuracy, y-অক্ষ বরাবর প্রদর্শিত হবে।
plt.plot(batch_size,accuracy,'b-o',label='Accuracy over batch size for 1000 iterations');
উপরের কোডটিই প্লটিং এর মূল কোডব্লক। plot একটা ফাংশন, এবং এই ফাংশনটা ব্যবহার করার জন্য কিছু প্যারামিটার প্রয়োজন। প্রথম দুটি প্যারামিটার মূলত x-অক্ষ এবং y-অক্ষ কে নির্দেশ করে। বাকিগুল ঐচ্ছিক। ‘b-o’ হচ্ছে ফরম্যাটিং অপশন যেখান b দিয়ে কালার blue এবং o দিয়ে টাইপ গোলাকার বোঝানো হয়েছে।
plt.xlabel('Batch Size')
plt.ylabel('Accuracy')
উপরের কোডটি লেবেল এর জন্য ব্যবহার করা হয়েছে।
plt.legend()
plt.show()
এবং সর্বশেষ, plt.show() দিয়ে গ্রাফটি প্রদর্শন করা হয়েছে। গ্রাফটি দেখতে নিচের মত হবে –