অধ্যায় 1 — AI-তে গণিত কেন গুরুত্বপূর্ণ

📖 একটি ছোট গল্প

কল্পনা করুন — আপনি একটি গাড়ি চালাচ্ছেন রাতে, কুয়াশার ভেতর দিয়ে। হেডলাইট ছাড়া। আপনি জানেন গাড়ি কোথায় যেতে হবে, কিন্তু কীভাবে যাবে তা দেখতে পাচ্ছেন না। AI শেখার সময় মাথেমেটিক্স ছাড়া কাজ করাটা ঠিক এই রকম — আপনি code লিখতে পারবেন, model train করতে পারবেন, কিন্তু "কেন কাজ করছে" বা "কেন কাজ করছে না" — সেটা কুয়াশার ভেতর।

এই অধ্যায়ে আমরা সেই হেডলাইটটাই জ্বালাবো।

Intuitive Explanation

AI মূলত একটি জিনিসই করে — data থেকে pattern খুঁজে বের করা। আর pattern খুঁজে বের করার ভাষাটাই হলো গণিত।

যখন আপনি ChatGPT-কে কোনো প্রশ্ন করেন, ভেতরে কয়েক বিলিয়ন সংখ্যা (parameter) মিলে একটি বিশাল গাণিতিক function চালু হয়। সেই function f(x) = y আকারে কাজ করে — যেখানে x আপনার প্রশ্ন, আর y উত্তর।

পুরো AI জগৎটাকে যদি একটি বাক্যে বলতে হয় — "একটি ভালো f খুঁজে বের করা"। আর সেই খোঁজার পথটাই হলো গণিত।

Visual Thinking

একটি ML model-কে কল্পনা করুন একটি পাহাড়ি ভূমি হিসেবে। প্রতিটি বিন্দু = model-এর একটি configuration। উচ্চতা = সেই configuration কতটুকু "ভুল" করছে (loss)। আমাদের কাজ — সবচেয়ে নিচু উপত্যকা খুঁজে বের করা।

💡 ইনসাইট

এই "নিচে নামার" পদ্ধতিটাই Gradient Descent। এটা শেখার জন্য আমাদের দরকার Calculus। নিচে নামার দিক বের করতে দরকার Linear Algebra। ভুল কতটা নিশ্চিতভাবে কমছে তা মাপতে দরকার Probability & Statistics।

Mathematical Intuition

প্রতিটি ML model আসলে এই রূপটিরই বিভিন্ন রূপ:

y = f(x; θ)

x — input data (image, text, audio, যা-ই হোক)
θ (theta) — model-এর parameter (যা শেখা হয়)
y — output (prediction)
f — মডেলের গাণিতিক structure

Training-এর সময় আমরা একটি loss function L(θ) minimize করি:

θ* = argmin_θ L(θ)

এই একটিমাত্র সমীকরণের ভেতরে লুকিয়ে আছে সমস্ত আধুনিক AI — GPT, Stable Diffusion, AlphaFold, সব কিছু।

Real-world AI Applications

কোথায় কোন গণিত লাগে?

Image Recognition (CNN) — Linear Algebra (matrix convolution), Calculus (backprop)
ChatGPT / LLM — Linear Algebra (attention), Probability (softmax), Optimization (Adam)
Recommendation System — Matrix factorization, SVD, Probability
Self-driving car — Probability (Bayesian filtering), Optimization, Linear Algebra
Stable Diffusion — Probability distributions, Calculus, Information theory

✨ টিপ

লক্ষ্য করুন — চারটি core বিষয় বারবার ফিরে আসে: Linear Algebra, Calculus, Probability, Optimization। এই বইয়ের প্রথম অর্ধেক এই চারটি pillar-এর উপর দাঁড়ানো।

Visual / Graph Ideas

একটি 3D "loss landscape" — পাহাড় ও উপত্যকা সহ
একটি ছোট ball সেই surface-এ ধীরে ধীরে নিচে নামছে (gradient descent)
প্রতিটি step-এ ball-এর position-এর সাথে গাণিতিক equation মিলিয়ে দেখানো

(পরবর্তী অধ্যায়গুলোতে আমরা এগুলো interactive playground-এ চালিয়ে দেখব।)

Python Implementation

একদম প্রথম একটি AI "model" — যা শুধু একটি সংখ্যা guess করতে শেখে। কোনো library নেই, শুধু math।

pythonPython · NumPy

# Tiny AI: learn the number 42 from scratch.
# Goal: find theta such that f(x) = theta is as close to 42 as possible.

theta = 0.0          # initial parameter (totally wrong)
target = 42.0        # the truth we want to learn
lr = 0.1             # learning rate

for step in range(100):
    prediction = theta
    loss = (prediction - target) ** 2          # squared error
    grad = 2 * (prediction - target)           # derivative of loss w.r.t. theta
    theta = theta - lr * grad                  # gradient descent step

    if step % 10 == 0:
        print(f"step={step:3d}  theta={theta:8.4f}  loss={loss:10.4f}")

print(f"\nLearned theta = {theta:.4f}  (target was {target})")

Step-by-step ব্যাখ্যা

theta = model-এর একমাত্র parameter, শুরুতে 0।
loss = কতটুকু ভুল করছি তার মাপ — (prediction - target)²।
grad = loss-এর derivative — কোন দিকে গেলে loss কমবে তা বলে।
theta - lr * grad = সেই দিকে একটু সরে যাওয়া।
১০০ বার repeat করলে theta ধীরে ধীরে 42-এর কাছে চলে আসে।

💡 ইনসাইট

এই ৬ লাইনের ভেতরেই লুকিয়ে আছে GPT-5 প্রশিক্ষণের একই মূল idea — শুধু parameter সংখ্যা ১ থেকে ১৭৫ বিলিয়নে নিয়ে যাওয়া হয়েছে।

Common Mistakes

"আমি code পারি, math লাগবে না" — model debug করতে গিয়ে আটকে যাবেন।
সব formula মুখস্থ করার চেষ্টা — intuition আগে, formula পরে।
একসাথে সব topic শেখা — roadmap মেনে ধাপে ধাপে এগোতে হবে।
Visualization skip করা — গণিতকে "দেখতে" না পারলে সেটা mystery থেকে যায়।

Practice Tasks

উপরের code-এ target = 100 দিয়ে চালান। theta কতগুলো step-এ 100-এর কাছে পৌঁছায়?
lr = 1.5 দিয়ে চালান। কী ঘটে? কেন?
lr = 0.001 দিয়ে চালান। কী পার্থক্য দেখলেন?

Assignment

একটি কাগজে নিজে লিখুন — আপনার পরিচিত যেকোনো ৫টি AI product (e.g. Google Translate, YouTube recommendation, Face Unlock, Siri, GPS route)। প্রতিটির পাশে অনুমান করুন কোন ৩টি গণিতের শাখা সেখানে সবচেয়ে বেশি ব্যবহৃত হতে পারে।

বইয়ের শেষে এই উত্তরে ফিরে আসুন — দেখবেন আপনার intuition কতটা পাল্টে গেছে।

Interview Questions

"AI engineer-এর জন্য math কতটুকু জরুরি?" — আপনি কীভাবে উত্তর দেবেন?
একটি simple linear regression-এর behind-the-scene কোন কোন math concept কাজ করে?
Loss function কী এবং কেন দরকার?
Gradient descent কেন কাজ করে — intuitively ব্যাখ্যা করুন।

Mini Project

Project: "Number Guesser AI" — উপরের code-কে বাড়িয়ে এমন একটি model বানান যেটি একসাথে ৩টি ভিন্ন target সংখ্যা শিখতে পারে (multi-output)।

প্রতিটি target-এর জন্য আলাদা theta রাখুন, প্রতিটির জন্য আলাদা loss এবং gradient হিসাব করুন।

Summary · সারসংক্ষেপ

AI = একটি ভালো function f(x; θ) খুঁজে বের করা।
সেই খোঁজার ভাষাটাই গণিত — Linear Algebra, Calculus, Probability, Optimization।
প্রতিটি modern AI system এই চার শাখার বিভিন্ন combination।
৬ লাইনের একটি gradient descent loop-এর ভেতরেই GPT-এর মূল idea লুকিয়ে আছে।
Math মুখস্থ নয় — math দেখতে এবং অনুভব করতে শেখাই হলো এই বইয়ের লক্ষ্য।

✨ পরবর্তী পদক্ষেপ

পরের অধ্যায়ে আমরা Number System-এর foundation দিয়ে শুরু করব — integers, fractions, exponents, logarithms — যা ছাড়া কোনো ML formula পড়া যায় না।

পরবর্তী · CH 2

Number System Fundamentals