Student Performance Prediction

Objective

This project focuses on building predictive models to forecast student success or risk of dropout based on academic trajectory, demographics, and socio-economic factors. The dataset consists of 3,500 instances with 36 attributes, covering various student attributes such as marital status, admission grades, and parental occupation, among others.

Problem Statement

The objective is to develop a machine learning model to predict student outcomes using several techniques learned throughout the Data Science course, including:

KNN
Linear Discriminant Analysis
Logistic Regression
Random Forests
Support Vector Machines
Neural Networks

The dataset includes the following attributes:

Marital status, application mode, academic course, admission grades, parental occupation, educational special needs, tuition status, and various curricular unit performance indicators, along with economic indicators like unemployment and inflation rates.

Methodology

The following tasks were carried out:

Data preprocessing and cleaning.
Exploratory data analysis (EDA).
Model selection and evaluation using various machine learning techniques.
Evaluation of model accuracy, complexity, and performance metrics such as F1 score, accuracy, and AUC.
Justification of the final selected model based on both accuracy and complexity.

Key Features

Algorithms Implemented: KNN, Logistic Regression, SVM, Random Forest, and Neural Networks.
Tools Used: R, Python, and associated data analysis libraries.

Conclusion

The final model successfully predicts student performance, with a focus on balancing model accuracy and interpretability. The report includes a detailed comparison of the different models applied, with justifications for the final selection.

Extra Work

Additional techniques and improvements were explored, such as boosting and unsupervised methods, using advanced techniques for improved predictive accuracy.

Name		Name	Last commit message	Last commit date
Latest commit History 106 Commits
Activity1		Activity1
Activity2		Activity2
Activity3		Activity3
Activity4		Activity4
Activity5		Activity5
Activity6		Activity6
Activity7		Activity7
Activity8		Activity8
Activity9		Activity9
Assignment1		Assignment1
Assignment2		Assignment2
Assignment3		Assignment3
Assignment4		Assignment4
Assignment5		Assignment5
Lecture1		Lecture1
Lecture2		Lecture2
Lecture3		Lecture3
Lecture4		Lecture4
Lecture5		Lecture5
Lecture6		Lecture6
Part2		Part2
.gitignore		.gitignore
README.md		README.md
Rplots.pdf		Rplots.pdf
WineQT.csv		WineQT.csv
breast_cancer.RData		breast_cancer.RData
dataset.csv		dataset.csv
kchousing.RData		kchousing.RData
pima.RData		pima.RData
winequality-red.csv		winequality-red.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Student Performance Prediction

Objective

Problem Statement

Methodology

Key Features

Conclusion

Extra Work

About

Releases

Packages

Languages

hamzafer/Student-Performance-Prediction

Folders and files

Latest commit

History

Repository files navigation

Student Performance Prediction

Objective

Problem Statement

Methodology

Key Features

Conclusion

Extra Work

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages