কল্পনা করুন — আপনি একটি গাড়ি চালাচ্ছেন রাতে, কুয়াশার ভেতর দিয়ে। হেডলাইট ছাড়া। আপনি জানেন গাড়ি কোথায় যেতে হবে, কিন্তু কীভাবে যাবে তা দেখতে পাচ্ছেন না। AI শেখার সময় মাথেমেটিক্স ছাড়া কাজ করাটা ঠিক এই রকম — আপনি code লিখতে পারবেন, model train করতে পারবেন, কিন্তু "কেন কাজ করছে" বা "কেন কাজ করছে না" — সেটা কুয়াশার ভেতর।
এই অধ্যায়ে আমরা সেই হেডলাইটটাই জ্বালাবো।
Intuitive Explanation
AI মূলত একটি জিনিসই করে — data থেকে pattern খুঁজে বের করা। আর pattern খুঁজে বের করার ভাষাটাই হলো গণিত।
যখন আপনি ChatGPT-কে কোনো প্রশ্ন করেন, ভেতরে কয়েক বিলিয়ন সংখ্যা (parameter) মিলে একটি বিশাল গাণিতিক function চালু হয়। সেই function f(x) = y আকারে কাজ করে — যেখানে x আপনার প্রশ্ন, আর y উত্তর।
পুরো AI জগৎটাকে যদি একটি বাক্যে বলতে হয় — "একটি ভালো f খুঁজে বের করা"। আর সেই খোঁজার পথটাই হলো গণিত।
Visual Thinking
একটি ML model-কে কল্পনা করুন একটি পাহাড়ি ভূমি হিসেবে। প্রতিটি বিন্দু = model-এর একটি configuration। উচ্চতা = সেই configuration কতটুকু "ভুল" করছে (loss)। আমাদের কাজ — সবচেয়ে নিচু উপত্যকা খুঁজে বের করা।
Mathematical Intuition
প্রতিটি ML model আসলে এই রূপটিরই বিভিন্ন রূপ:
- x — input data (image, text, audio, যা-ই হোক)
- θ (theta) — model-এর parameter (যা শেখা হয়)
- y — output (prediction)
- f — মডেলের গাণিতিক structure
Training-এর সময় আমরা একটি loss function L(θ) minimize করি:
এই একটিমাত্র সমীকরণের ভেতরে লুকিয়ে আছে সমস্ত আধুনিক AI — GPT, Stable Diffusion, AlphaFold, সব কিছু।
Real-world AI Applications
কোথায় কোন গণিত লাগে?
- Image Recognition (CNN) — Linear Algebra (matrix convolution), Calculus (backprop)
- ChatGPT / LLM — Linear Algebra (attention), Probability (softmax), Optimization (Adam)
- Recommendation System — Matrix factorization, SVD, Probability
- Self-driving car — Probability (Bayesian filtering), Optimization, Linear Algebra
- Stable Diffusion — Probability distributions, Calculus, Information theory
Visual / Graph Ideas
- একটি 3D "loss landscape" — পাহাড় ও উপত্যকা সহ
- একটি ছোট ball সেই surface-এ ধীরে ধীরে নিচে নামছে (gradient descent)
- প্রতিটি step-এ ball-এর position-এর সাথে গাণিতিক equation মিলিয়ে দেখানো
(পরবর্তী অধ্যায়গুলোতে আমরা এগুলো interactive playground-এ চালিয়ে দেখব।)
Python Implementation
একদম প্রথম একটি AI "model" — যা শুধু একটি সংখ্যা guess করতে শেখে। কোনো library নেই, শুধু math।
# Tiny AI: learn the number 42 from scratch.
# Goal: find theta such that f(x) = theta is as close to 42 as possible.
theta = 0.0 # initial parameter (totally wrong)
target = 42.0 # the truth we want to learn
lr = 0.1 # learning rate
for step in range(100):
prediction = theta
loss = (prediction - target) ** 2 # squared error
grad = 2 * (prediction - target) # derivative of loss w.r.t. theta
theta = theta - lr * grad # gradient descent step
if step % 10 == 0:
print(f"step={step:3d} theta={theta:8.4f} loss={loss:10.4f}")
print(f"\nLearned theta = {theta:.4f} (target was {target})")Step-by-step ব্যাখ্যা
- theta = model-এর একমাত্র parameter, শুরুতে 0।
- loss = কতটুকু ভুল করছি তার মাপ — (prediction - target)²।
- grad = loss-এর derivative — কোন দিকে গেলে loss কমবে তা বলে।
- theta - lr * grad = সেই দিকে একটু সরে যাওয়া।
- ১০০ বার repeat করলে theta ধীরে ধীরে 42-এর কাছে চলে আসে।
Common Mistakes
- "আমি code পারি, math লাগবে না" — model debug করতে গিয়ে আটকে যাবেন।
- সব formula মুখস্থ করার চেষ্টা — intuition আগে, formula পরে।
- একসাথে সব topic শেখা — roadmap মেনে ধাপে ধাপে এগোতে হবে।
- Visualization skip করা — গণিতকে "দেখতে" না পারলে সেটা mystery থেকে যায়।
Practice Tasks
- উপরের code-এ target = 100 দিয়ে চালান। theta কতগুলো step-এ 100-এর কাছে পৌঁছায়?
- lr = 1.5 দিয়ে চালান। কী ঘটে? কেন?
- lr = 0.001 দিয়ে চালান। কী পার্থক্য দেখলেন?
Assignment
একটি কাগজে নিজে লিখুন — আপনার পরিচিত যেকোনো ৫টি AI product (e.g. Google Translate, YouTube recommendation, Face Unlock, Siri, GPS route)। প্রতিটির পাশে অনুমান করুন কোন ৩টি গণিতের শাখা সেখানে সবচেয়ে বেশি ব্যবহৃত হতে পারে।
বইয়ের শেষে এই উত্তরে ফিরে আসুন — দেখবেন আপনার intuition কতটা পাল্টে গেছে।
Interview Questions
- "AI engineer-এর জন্য math কতটুকু জরুরি?" — আপনি কীভাবে উত্তর দেবেন?
- একটি simple linear regression-এর behind-the-scene কোন কোন math concept কাজ করে?
- Loss function কী এবং কেন দরকার?
- Gradient descent কেন কাজ করে — intuitively ব্যাখ্যা করুন।
Mini Project
Project: "Number Guesser AI" — উপরের code-কে বাড়িয়ে এমন একটি model বানান যেটি একসাথে ৩টি ভিন্ন target সংখ্যা শিখতে পারে (multi-output)।
প্রতিটি target-এর জন্য আলাদা theta রাখুন, প্রতিটির জন্য আলাদা loss এবং gradient হিসাব করুন।
Summary · সারসংক্ষেপ
- AI = একটি ভালো function f(x; θ) খুঁজে বের করা।
- সেই খোঁজার ভাষাটাই গণিত — Linear Algebra, Calculus, Probability, Optimization।
- প্রতিটি modern AI system এই চার শাখার বিভিন্ন combination।
- ৬ লাইনের একটি gradient descent loop-এর ভেতরেই GPT-এর মূল idea লুকিয়ে আছে।
- Math মুখস্থ নয় — math দেখতে এবং অনুভব করতে শেখাই হলো এই বইয়ের লক্ষ্য।