Heart Disease Classification Models

This repository demonstrates the implementation and evaluation of two machine learning models—Logistic Regression and Random Forest Classifier for predicting heart disease. It includes data preprocessing, exploratory data analysis (EDA), model training, testing, and statistical evaluation of model performance using permutation tests.

Features

Data Preprocessing: Handling numerical and categorical features using scaling and one-hot encoding.
Exploratory Data Analysis (EDA):
- Scatterplot Matrix
- Correlation Matrix Heatmap
- Parallel Coordinates Plot
Machine Learning Models:
- Logistic Regression: A baseline linear model.
- Random Forest Classifier: A non-linear ensemble model.
Model Evaluation:
- Accuracy scores for training and testing datasets.
- Statistical significance test (Permutation Test) to compare model performance.
Visualization:
- Distribution of feature relationships.
- Histogram of accuracy differences from the permutation test.

Results Summary

Logistic Regression:
- Training Accuracy: 87%
- Testing Accuracy: 88%
Random Forest:
- Training Accuracy: 93%
- Testing Accuracy: 90%
Statistical Significance:
- Observed Accuracy Difference: 0.0195
- P-value: 0.7467
- Conclusion: No statistically significant difference between the models.

Requirements

Python 3.8+
Required libraries (install via pip):
- pandas
- numpy
- matplotlib
- seaborn
- scikit-learn

Installation

Clone the repository:

git clone https://github.com/ravindusenavirathna/Heart-Disease-Classification-Models.git
cd Heart-Disease-Classification-Models

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Heart-Disease-Classification-Models.ipynb		Heart-Disease-Classification-Models.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Heart Disease Classification Models

Features

Results Summary

Requirements

Installation

About

Releases

Packages

Languages

ravindusenavirathna/Heart-Disease-Classification-Models

Folders and files

Latest commit

History

Repository files navigation

Heart Disease Classification Models

Features

Results Summary

Requirements

Installation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages