📘 MACHINE LEARNING ASSIGNMENTS – UML501

Mehak | B.Tech COE (TIET)

This repository contains a collection of 8 Machine Learning assignments completed as part of coursework. Each assignment includes hands-on implementation of ML algorithms, reinforcing both theoretical knowledge and practical programming skills using Python.

📂 Assignment Overview

Assignment 1 – NumPy Operations & Matrix Computations

Objective: Introduction to numerical computing using NumPy
Key Tasks:

Array creation, slicing, reshaping, flattening
Matrix operations (addition, multiplication, inverse, determinant, eigenvalues)
Statistical measures (mean, median, SD, covariance, percentiles)
Image-to-array conversion & file handling

Assignment 2 – Data Preprocessing Techniques

Objective: Clean and transform raw data for ML models
Key Tasks:

Handling missing values & noise removal
Normalization & standardization
Binning & discretization
One-hot encoding, ordinal encoding
Similarity & correlation metrics (Jaccard, Cosine, Pearson, Simple Matching) Dataset: Bike Buyers Dataset (synthetic equivalent)

Assignment 3 – Regression Models & PCA

Objective: Compare analytical & iterative regression training
Key Tasks:

Linear Regression using Normal Equation + Gradient Descent
5-Fold Cross Validation evaluation
Model performance comparison via R² score
PCA for dimensionality reduction (before vs after comparison)

Assignment 4 – Web Scraping & Data Extraction

Objective: Collect real-world structured data
Key Tasks:

Static scraping using BeautifulSoup
Dynamic scraping using Selenium
Extracted data from:
- BooksToScrape
- IMDb Top 250 Movies
- TimeAndDate Global weather reports
Export to CSV for analysis

Assignment 5 – Ridge & Lasso Regression + Cross Validation

Objective: Regularized regression & model selection
Key Tasks:

Ridge Regression using Gradient Descent (with tuning of α & LR)
Linear vs Ridge vs Lasso comparison
RidgeCV & LassoCV on Boston Dataset
Hitters Dataset regression evaluation and best model justification

Assignment 6 – Naïve Bayes & GridSearchCV

Objective: Bayesian modeling and hyperparameter tuning
Key Tasks:

Gaussian Naive Bayes – manual & in-built implementation
GridSearchCV for best K in KNN

Assignment 7 – Support Vector Machines

Objective: Classification using different SVM kernels
Key Tasks:

SVC with Linear / Polynomial / RBF kernels
Metrics: Accuracy, Precision, Recall, F1-score
Confusion Matrix visualization
Effect of feature scaling on SVM performance

Assignment 8 – AdaBoost (Text, Medical & Sensor Data)

Objective: Boosting for stronger ensemble models
Parts Implemented:

SMS Spam Classification
- TF-IDF vectorization + manual AdaBoost (T=15) + sklearn AdaBoost
Heart Disease Prediction
- UCI Heart dataset with hypertuning of estimators & learning rate
WISDM Smartphone & Watch Motion Sensor Dataset
- Accelerometer windowing, feature extraction, manual AdaBoost vs sklearn AdaBoost

🧠 Learning Outcomes

Hands-on implementation of ML algorithms (regression, boosting, SVM, Naïve Bayes)
Understanding preprocessing, regularization & model evaluation
Experience with sensor, medical & text datasets
Practical ML pipeline skills (EDA → preprocessing → model → metrics)
Data scraping & automation using Python

🧰 Tools & Libraries Used

Python 3.x
NumPy, Pandas
Scikit-learn
Matplotlib & Seaborn
BeautifulSoup, Selenium
Jupyter / Spyder IDE

✍️ Author

Mehak
B.Tech – Computer Engineering (3rd Year)
Thapar Institute of Engineering and Technology
📧 mmehak2_be23@thapar.edu

⭐ Acknowledgement

This repository is part of the Machine Learning (UML501) coursework under the guidance of faculty at TIET, Patiala.

Name		Name	Last commit message	Last commit date
Latest commit History 28 Commits
MEHAK_102303792_Assig1.py		MEHAK_102303792_Assig1.py
MEHAK_102303792_Assig2.py		MEHAK_102303792_Assig2.py
MEHAK_102303792_Assig3.py		MEHAK_102303792_Assig3.py
MEHAK_102303792_Assig4.py		MEHAK_102303792_Assig4.py
MEHAK_102303792_Assig5.py		MEHAK_102303792_Assig5.py
MEHAK_102303792_Assig6.py		MEHAK_102303792_Assig6.py
MEHAK_102303792_Assig7.py		MEHAK_102303792_Assig7.py
MEHAK_102303792_Assig8.py		MEHAK_102303792_Assig8.py
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

📘 MACHINE LEARNING ASSIGNMENTS – UML501

Mehak | B.Tech COE (TIET)

📂 Assignment Overview

Assignment 1 – NumPy Operations & Matrix Computations

Assignment 2 – Data Preprocessing Techniques

Assignment 3 – Regression Models & PCA

Assignment 4 – Web Scraping & Data Extraction

Assignment 5 – Ridge & Lasso Regression + Cross Validation

Assignment 6 – Naïve Bayes & GridSearchCV

Assignment 7 – Support Vector Machines

Assignment 8 – AdaBoost (Text, Medical & Sensor Data)

🧠 Learning Outcomes

🧰 Tools & Libraries Used

✍️ Author

⭐ Acknowledgement

About

Uh oh!

Releases

Packages

Languages

Mehak2327/ML_Assignments

Folders and files

Latest commit

History

Repository files navigation

📘 MACHINE LEARNING ASSIGNMENTS – UML501

Mehak | B.Tech COE (TIET)

📂 Assignment Overview

Assignment 1 – NumPy Operations & Matrix Computations

Assignment 2 – Data Preprocessing Techniques

Assignment 3 – Regression Models & PCA

Assignment 4 – Web Scraping & Data Extraction

Assignment 5 – Ridge & Lasso Regression + Cross Validation

Assignment 6 – Naïve Bayes & GridSearchCV

Assignment 7 – Support Vector Machines

Assignment 8 – AdaBoost (Text, Medical & Sensor Data)

🧠 Learning Outcomes

🧰 Tools & Libraries Used

✍️ Author

⭐ Acknowledgement

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages