from pathlib import Path

import matplotlib.pyplot as plt
import pandas as pd
from sklearn.compose import ColumnTransformer
from sklearn.impute import SimpleImputer
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import ConfusionMatrixDisplay, classification_report
from sklearn.model_selection import train_test_split
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler

DATA_PATH = Path('Teen_Mental_Health_Dataset.csv')
df = pd.read_csv(DATA_PATH)

print('Rows:', len(df))
df.head()

# TODO: inspect info, summary statistics, missing values, and target class counts.

# TODO: create at least four visualizations.

features_df = df.copy()

# TODO: create engineered features.

# TODO: display your engineered features.

# TODO: choose features, train a model, and evaluate it.

Important note¶

Goals¶

Task 1 - Explore the dataset¶

Task 2 - Visual exploration¶

Task 3 - Feature engineering¶

Task 4 - Build a simple model¶

Task 5 - Open-ended interpretation and ethics¶

Open-Ended Lab - Teen Mental Health and Social Media¶

Important note¶

Goals¶

Task 1 - Explore the dataset¶

Task 2 - Visual exploration¶

Task 3 - Feature engineering¶

Task 4 - Build a simple model¶

Task 5 - Open-ended interpretation and ethics¶