🩺 Health Insurance Claim Prediction using XGBoost

This project aims to predict whether a health insurance claim will be approved or not, using machine learning techniques and SHAP-based model interpretability.

📌 Problem Statement

Insurance companies process thousands of health insurance claims. Identifying potentially fraudulent or rejected claims early can reduce losses and improve operational efficiency.

This project predicts whether a claim will be approved (1) or rejected (0) based on various features like patient age, diagnosis code, claim amount, procedure details, etc.

📂 Dataset

File: enhanced_health_insurance_claims.csv
Columns Used:
- ClaimID, ClaimDate, ClaimAmount
- PatientAge, PatientGender, DiagnosisCode, ProcedureCode
- ClaimType, ClaimSubmissionMethod, etc.
- ClaimApproved (Target variable: 1 = Approved, 0 = Rejected)

🛠️ Tech Stack

Tool	Purpose
Python	Core Programming Language
Pandas, NumPy	Data Processing
Matplotlib, Seaborn	Data Visualization
XGBoost	ML Model (Gradient Boosted Trees)
Scikit-learn	Train-test split, metrics
SHAP	Model Interpretability

🧠 Workflow

Load Dataset
Handle Missing Values
Convert Dates & Feature Engineering
Encode Categorical Variables
Split Dataset (Train/Test)
Train XGBoost Classifier
Model Evaluation (Accuracy, Report)
SHAP Analysis (Explainability)

📊 Results

Model Used: XGBoost Classifier
Accuracy: ~46.33%
Top Features: ClaimAmount, PatientAge, DiagnosisCode_X, etc.
Explainability: SHAP summary plot included

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitignore		.gitignore
README.md		README.md
app.py		app.py
enhanced_health_insurance_claims.csv		enhanced_health_insurance_claims.csv
enhanced_health_insurance_claims.ipynb		enhanced_health_insurance_claims.ipynb
model.pkl		model.pkl
requirement.txt		requirement.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🩺 Health Insurance Claim Prediction using XGBoost

📌 Problem Statement

📂 Dataset

🛠️ Tech Stack

🧠 Workflow

📊 Results

📈 SHAP Summary Plot

📁 Project Structure

About

Uh oh!

Releases

Packages

Languages

Dhruvii0203/Health-Insurance-Prediction

Folders and files

Latest commit

History

Repository files navigation

🩺 Health Insurance Claim Prediction using XGBoost

📌 Problem Statement

📂 Dataset

🛠️ Tech Stack

🧠 Workflow

📊 Results

📈 SHAP Summary Plot

📁 Project Structure

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages