from __future__ import annotations

from pathlib import Path

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
from sklearn.compose import ColumnTransformer
from sklearn.metrics import (
    RocCurveDisplay,
    PrecisionRecallDisplay,
    classification_report,
    confusion_matrix,
    accuracy_score,
    roc_auc_score,
    average_precision_score,
)
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from torch.utils.data import DataLoader, TensorDataset

plt.rcParams['figure.figsize'] = (8, 4)
torch.manual_seed(42)
np.random.seed(42)

DATA_PATH = Path('heart.csv')
df = pd.read_csv(DATA_PATH)

print('Rows, columns:', df.shape)
print('Target distribution:')
print(df['HeartDisease'].value_counts())
df.head()

# TODO: Use `info`, `describe`, groupby summaries, and missing-value checks to answer Task 1.

# TODO: Build at least four informative visualizations for Task 2.

TARGET = 'HeartDisease'

# TODO: Build X (features dataframe), y (float32 0/1 array), lists numeric_features / categorical_features.
# TODO: ColumnTransformer with StandardScaler + OneHotEncoder(sparse_output=False, handle_unknown='ignore').
# TODO: Stratified splits → X_train_df, X_val_df, X_test_df and matching y vectors (~64% / 16% / 20%).
# TODO: preprocessor.fit(train only); transform train/val/test → X_train, X_val, X_test as float32.
# TODO: input_dim = X_train.shape[1]; print train/val/test sizes and input_dim.

if torch.cuda.is_available():
    device = torch.device('cuda')
elif torch.backends.mps.is_available():
    device = torch.device('mps')
else:
    device = torch.device('cpu')


def make_loaders(X_tr, y_tr, X_va, y_va, batch_size: int = 32):
    tr_ds = TensorDataset(torch.from_numpy(X_tr), torch.from_numpy(y_tr))
    va_ds = TensorDataset(torch.from_numpy(X_va), torch.from_numpy(y_va))
    return (
        DataLoader(tr_ds, batch_size=batch_size, shuffle=True),
        DataLoader(va_ds, batch_size=batch_size, shuffle=False),
    )


# TODO: class MLP(nn.Module): ...
# TODO: def train_mlp(...) -> trained model + history dict with 'train_loss' and 'val_loss' lists
# TODO: Instantiate MLP_Small, MLP_Deep, MLP_Wide; train each; store in `trained` and `histories`

trained: dict[str, nn.Module] = {}
histories: dict[str, dict] = {}

# TODO: One figure: validation loss curves for all models in `histories`.

# TODO: Implement predict_proba(model, X_numpy) using torch.no_grad(), logits, torch.sigmoid.
# TODO: For each model in `trained`, collect test probabilities, threshold at 0.5 for confusion matrix / report.
# TODO: Build a small metrics table (accuracy, roc_auc, pr_auc, parameter count).

metrics_df = None  # replace with your summary DataFrame
test_probs: dict[str, np.ndarray] = {}

# TODO: Side-by-side ROC and precision–recall curves for all models (test set). Use RocCurveDisplay / PrecisionRecallDisplay.

# TODO: Plot confusion matrices (one subplot per model) at threshold 0.5.

# TODO: Pick best model (e.g. metrics_df['roc_auc'].idxmax()), plot overlapping histograms of predicted probabilities by true label.

Model	Description
MLP_Small	One hidden layer (32 units). Strong baseline for small tabular data.
MLP_Deep	Three hidden layers (64→48→24) with dropout between hidden layers.
MLP_Wide	Two wide layers (128→128) with dropout.

Lab — Heart disease risk¶

Important¶

Goals¶

Task 1 — Explore the dataset¶

Task 2 — Visual exploration¶

Task 3 — Preprocess for neural networks¶

Task 4 — PyTorch MLPs: three architectures¶

Task 5 — Compare validation learning curves¶

Task 6 — Test-set metrics and ROC / precision–recall¶

Task 7 — Predicted probabilities¶

Task 8 — Interpretation, limitations, and ethics¶