Я работаю над документом, демонстрирующим использование логистики c регрессии. Я пытаюсь продемонстрировать, что регулярная линейная вероятностная модель недостаточна, когда зависимая переменная является дихотомической, поскольку члены ошибки не представляют нормальное распределение.
В моем наборе данных есть две переменные:
- Пол: Мужской, Женский
- Рост: непрерывная переменная, содержащая высоту каждого наблюдения.
Моя модель логистики c пытается предсказать, является ли наблюдение мужчиной или женщиной, основываясь на их росте.
Я полагаю, что распределение будет каким-то двойным гауссовым распределением, но как я могу построить это визуально?