01
আমি যে বিষয়ে গবেষণা করি
ব্যবহারকারী-বান্ধব ইন্টারফেস তৈরি এবং এআই অ্যাপ্লিকেশনগুলি অনুসন্ধান করার বিষয়ে গভীর আগ্রহ নিয়ে আমি সক্রিয়ভাবে মানব-কম্পিউটার মিথস্ক্রিয়া (Human computer interaction), কৃত্রিম বুদ্ধিমত্তা (Artificial Intelligence), ভার্চুয়াল রিয়েলিটি (Virtual Reality) এবং কম্পিউটার ভিশন (Computer Vision) নিয়ে গবেষণা করছি। প্রযুক্তির উৎকর্ষ সাধনে আমি এআই দিয়ে হাতে কলমে কাজ করতে উপভোগ করি এবং বিভিন্ন কনফারেন্স এ যোগদান ও গবেষণা প্রবন্ধ প্রকাশের মাধ্যমে হালনাগাদ থাকি।
02
আমার দৃষ্টিভঙ্গি
আমি নিয়মিত শেখার নতুন কিছু শেখার চেষ্টা করি এবং বাস্তব জীবনের অভিজ্ঞতা থেকে নতুন কিছু উদ্ভাবনের চেষ্টা করি। । আমি চ্যালেঞ্জগুলি চিহ্নিত করি এবং গবেষণা করি। আমি ব্যবহারকারী-কেন্দ্রিক সমাধানগুলি বিকাশের জন্য অত্যাধুনিক কৌশলগুলি ব্যবহার করি, যাতে আমার কাজ প্রযুক্তিগতভাবে উন্নত এবং প্রভাবশালী হয় তা নিশ্চিত করে।
আমার লক্ষ্য
মানুষের জীবনকে উল্লেখযোগ্যভাবে উন্নত করতে অত্যাধুনিক প্রযুক্তির ব্যবহার করাই আমার লক্ষ্য। নিবেদিত গবেষণার মাধ্যমে, আমি প্রতিদিনের অভিজ্ঞতাকে সহজ করা, অ্যাক্সেসযোগ্যতা বাড়াতে এবং ব্যাপকভাবে জ্ঞান ছড়িয়ে দেওয়ার লক্ষ্য রাখি, যাতে প্রযুক্তি সকলের উপকারে আসে। আমার চূড়ান্ত লক্ষ্য হল সকলের জন্য আরও অন্তর্ভুক্ত এবং অ্যাক্সেসযোগ্য ভবিষ্যত তৈরি করা।
মানব-কম্পিউটার মিথস্ক্রিয়া
মানব-কম্পিউটার মিথস্ক্রিয়ার ক্ষেত্রে, আমি বায়ু-লেখা, অঙ্গভঙ্গি স্বীকৃতি, এবং ইশারা-ভিত্তিক লেখার সিস্টেমগুলি নিয়ে গবেষণা করি। এই প্রযুক্তিগুলি কম্পিউটারের মিথস্ক্রিয়া করার উদ্ভাবনী এবং অ্যাক্সেসযোগ্য উপায় সরবরাহ করে, ব্যক্তি বিশেষত যারা প্রতিবন্ধী তাদেরকে উপকৃত করে, বিকল্প ইনপুট পদ্ধতি প্রদান করে এবং ডিজিটাল সরঞ্জাম এবং তথ্যের সামগ্রিক অ্যাক্সেসযোগ্যতা উন্নত করে।
কৃত্রিম বুদ্ধিমত্তা
মানব-কম্পিউটার মিথস্ক্রিয়া প্রয়োগ করতে CNN, LSTM, GRU এবং নেটওয়ার্ক ফিউশন ব্যবহার করে অঙ্গভঙ্গি স্বীকৃতি এবং বায়ু লেখার মত জটিল কাজগুলো করে থাকি। এই প্রযুক্তির লক্ষ্য মানুষ এবং কম্পিউটারের মধ্যে স্বজ্ঞাত এবং অ্যাক্সেসযোগ্য মিথস্ক্রিয়া সহজতর করা, বিভিন্ন প্রসঙ্গে যোগাযোগ এবং ব্যবহারযোগ্যতা বৃদ্ধি করা।
কম্পিউটার ভিশন
আমার কম্পিউটার ভিশন গবেষণায়, আমি ইন্টিগ্রাল ইমেজিং মাইক্রোস্কোপির জন্য ইমেজ সুপার-রেজোলিউশন এর জন্য জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক (GAN) সহ ডিপ লার্নিং অ্যালগরিদম প্রয়োগ করেছি। এই কৌশলটি বৈজ্ঞানিক এবং চিকিৎসা প্রসঙ্গে মাইক্রোস্কোপিক ইমেজিংয়ের বিশদ এবং প্রযোজ্যতা বৃদ্ধি করে। এই পদ্ধতিতে সাধারণ অপটিক্যাল লেন্সগুলি যা অর্জন করতে পারে তার থেকে আট গুণ বেশি করে ইমেজ রেজোলিউশনকে উল্লেখযোগ্যভাবে বৃদ্ধি করা যায়।
ভার্চুয়াল বাস্তবতা
আমি ভার্চুয়াল বাস্তবতা নিয়ে গবেষণা পরিচালনা করি, বর্তমানে এমন একটি প্রকল্প নিয়ে কাজ করছি যার মাধ্যমে ভার্চুয়াল মাধ্যমে আমেরিকান সাইন ল্যাঙ্গুয়েজ (ASL) শেখায়। ভার্চুয়াল পরিবেশের মধ্যে একটি সাইনিং অবতার ASL ভাষা শেখায় এবং মেশিন সেটা সঠিক নাকি ভুল সেটা তাৎক্ষণিক প্রতিক্রিয়া প্রদান করে, যেটি ব্যবহারকারীদের জন্য একটি আকর্ষক এবং ইন্টারেক্টিভ শেখার অভিজ্ঞতা তৈরি করে।
পরিসংখ্যান
অভিজ্ঞতা
সাত বছরের বেশি গবেষণার অভিজ্ঞতার সাথে, আমি 20+ প্রকাশিত নিবন্ধ লিখেছি, 140+ পণ্ডিতের কাজ পর্যালোচনা করেছি এবং 150+ উদ্ধৃতি সংগ্রহ করেছি। এই অর্জনগুলি জ্ঞানের অগ্রগতি, সমকক্ষ পর্যালোচনায় দক্ষতা, এবং একাডেমিক সম্প্রদায়ের উপর উল্লেখযোগ্য প্রভাবের প্রতি আমার প্রতিশ্রুতি প্রতিফলিত করে।
প্রকাশিত প্রবন্ধ
প্রাতিষ্ঠানিক গবেষণার অভিজ্ঞতার বছর
স্বীকৃত জার্নাল নিবন্ধ পর্যালোচনা
সাইটেশন
সেরা ৫ গবেষণা প্রবন্ধ
- M. S. Alam et al., ‘ASL champ!: a virtual reality game with deep-learning driven sign recognition’, Computers & Education: X Reality, vol. 4, p. 100059, 2024, doi: https://doi.org/10.1016/j.cexr.2024.100059
- M. S. Alam, K. -C. Kwon and N. Kim, “TARNet: An Efficient and Lightweight Trajectory-Based Air-Writing Recognition Model Using a CNN and LSTM Network, Volume 2022, doi: https://doi.org/10.1155/2022/6063779
- M. S. Alam, K. -C. Kwon and N. Kim, “Implementation of a Character Recognition System Based on Finger-Joint Tracking Using a Depth Camera,” in IEEE Transactions on Human-Machine Systems, vol. 51, no. 3, pp. 229-241, June 2021, doi: https://doi.org/10.1109/THMS.2021.3066854.
- M. S. Alam, K. -C. Kwon, M. -U. Erdenebat, M. Y. Abbass; M. A. Alam, and N. Kim, “Super-Resolution Enhancement Method Based on Generative Adversarial Network for Integral Imaging Microscopy” in Sensors 2021, 21, 2164. https://doi.org/10.3390/s21062164.
- M.S. Alam, K.-C. Kwon; M.A. Alam, M.Y. Abbass, S.M. Imtiaz, N. Kim, “Trajectory-Based Air-Writing Recognition Using Deep Neural Network and Depth Sensor,” in Sensors 2020, 20, 376. https://doi.org/10.3390/s20020376
ব্লগ থেকে সাম্প্রতিক
অ্যাকটিভেশন ফাংশন (Activation Function)
যেকোন নিউরাল নেটওয়ার্কের (Neural Network) ক্ষেত্রেই অ্যাকটিভেশন ফাংশন অনেক গুরুত্বপূর্ণ ভূমিকা পালন করে। অ্যাকটিভেশন নাম দেখেই বোঝা যাচ্ছে এই ফাংশনের কাজ হচ্ছে কোন কিছু ট্রিগার করা। হ্যা, সেটাই। অ্যাকটিভেশন ফাংশন কোন একটি নিউরন (Neuron) বা নোড (Node) কে ট্রিগার করে।...
ক্রস ভ্যালিডেশন (Cross Validation)
মেশিন লার্নিং (Machine Learning) এ ক্রস ভ্যালিডেশন (Cross Validation) একটি বহুল ব্যবহৃত শব্দ। সাধারণত কোন মডেলকে যাচাই বাছাই করার জন্য কিছু টেস্টিং ডাটার ( Testing Data) প্রয়োজন পড়ে। অনেক সময় দেখা যায় যে ট্রেইনিং ডাটার (Training Data) সাথে টেস্টিং ডাটার কোন মিল নেই,...
পয়েন্ট ক্লাউড
পয়েন্ট ক্লাউড (Point Cloud) নাম শুনেই বোঝা যাচ্ছে যে পয়েন্টের মেঘ। অর্থ্যাৎ কোথায় কোথায় পয়েন্ট আছে সেটার একটা মেঘ তৈরি করা। সাধারণ ক্যামেরা বা টু ডাইমেনশনাল ক্যামেরাতে কোন বস্তুর Depth বা গভীরতা বোঝা জায় না। কিন্তু ত্রিমাত্রিক ছবি বা ক্যামেরাতে বস্তুর x,y,z...
কত টাকা চাই?
কয়েকদিন আগেই আমার এক রক্তীয়* আমাকে প্রশ্ন করল, কবে পড়াশোনা শেষ করবি, কবে চাকরি-বাকরি করবি আর কবেই বা টাকা পয়সা কামাবি, টাকা পয়সাও তো দরকার। আমার মত কিঞ্চিৎ নৈরাশ্যবাদীর কাছে এ এক জটিল প্রশ্ন! কি উত্তর দেওয়া যায় চিন্তা করতে করতে বললাম - "আচ্ছা কত টাকা দরকার আপনার?"...
পিক্সেল(Pixel), হোগেল(Hogel) এবং ভক্সেল(Voxel)
আমরা সাধারণত পিক্সেল(Pixel) কথাটিই সচরাচর শুনে থাকি, কিন্তু ত্রিমাত্রিক পরিবেশে আমরা সরাসরি পিক্সেল কথাটি ব্যবহার করতে পারিনা। এখানে আমরা দেখব পিক্সেল(Pixel), হোগেল(Hogel) এবং ভক্সেল(Voxel) কি এবং কেন। পিক্সেল(Pixel) পিক্সেল এর ধারণাটি দ্বিমাত্রিক তলের কোন...
বেসিক গিট কমান্ড (Basic Git Command)
এই পোস্টের শুরুতেই আমি ধরে নিচ্ছি যে আপনি গিট সম্পর্কে ধারণা রাখেন এবং এটার ব্যবহার ও উদ্দেশ্য সম্পর্কে জ্ঞাত। তাই এসম্পর্কে আর বেশিদূর যাচ্ছিনা। গিটে কিছু বেসিক কমান্ড আছে যেটা প্রায়ই প্রয়োজন পড়ে। সেগুলো নিয়ে সংক্ষিপ্ত আকারে এখানে আলোকপাত করব। এই পোস্ট থেকে আমরা...
পানডাস (Pandas)
পানডাস বা Pandas হল পাইথন প্রোগ্রামিং ভাষার জন্য একটি ওপেন সোর্স ডেটা ম্যানিপুলেশন লাইব্রেরি। এটি বৃহৎ ডেটাসেটগুলিকে দক্ষতার সাথে সংরক্ষণ, ম্যানিপুলেট করা, বিভিন্ন ফরম্যাটে ডেটা পড়া, এবং লেখার জন্য সহজ কিছু ডাটা স্ট্রাকচার প্রদান করে। ডাটা সায়েন্স, মেশিন লার্নিং এবং...
শিক্ষার্থী, দূর্ঘটণায় মরলে মেধাবী হয়, আর প্রেমে আত্নহত্যা করলে হয় ট্রু লাভ
গতকয়েকদিন ধরেই ফেসবুকের নিউজফিডে একটা খবর ভেসে আসছে, অনেকেই শেয়ার করেছেন, যার শিরোনাম – “ফজরের নামায পড়েই ঝুলে পড়ব” হ্যা, আমি সাতক্ষীরার ছেলে সাদিদ ফারজিন অর্ণব এর কথা বলছি যে ৯ মে ২০১৬ আত্নহত্যা করেছে। খবরটা নিয়ে অনেক কথা শোনা যাচ্ছে। ছেলেটা যে, মেয়েটাকে অনেক...
দ্বিতীয় ভ্যালেন্টাইন
গতকাল পহেলা বৈশাখ ১৪২৩ গেল। ফেসবুকে লগইন করতেই অনেক ট্রল ছবি দেখতে পেলাম, আবার অনেক রঙ বেরং এর ছবিও দেখতে পেলাম কাপলদের। ট্রলগুলোও ছিল এই কাপলদের নিয়েই। পহেলা বৈশাখে সারাদিন ঘুমানোর পরে বিকালে ফ্রেশ মাথায় বিষয়টা নিয়ে একটু চিন্তা করলাম। আসলে বিষয়টা তেমন না, বিষয়টা...