алгоритм прогнозирования числовых значений номиналов - PullRequest
0 голосов
/ 02 марта 2019

Я новичок в науке о данных

В настоящее время я работаю над оценками студентов.

Это особенности набора данных

1- Gender

2- IQLevel

3- WritingScore

4- MathScore

Примерданные

Мужской уровень C 98 93 Мужской уровень B 62 70 Женский уровень A 81 88 Женский уровень D 53 48

в этом наборе данных Я пытаюсь предсказать оценку по математике на основе других функций

Я использую алгоритм линейной регрессии Python

Для этого мне пришлось преобразовать Gender и IQLevel в числовые значения

Gender : Male --> 1     Female --> 2

IQLevel Level A --> 1   Level B --> 2     Level C --> 3
    Level D --> 4

Ожидается, что IQ будет коррелирован с математикой, нов поле IQ мы используем номинальное значение (классификация)

. Таким образом, преобразовав IQLevel в числовой определенным образом, мы можем получить отношение между IQLevel или не

в первом примере

IQLevel Level A --> 1   Level B --> 2     Level C --> 3
    Level D --> 4

линейного отношения нет

enter image description here

, но если изменить преобразование в числовое значение другим способом, мы получим линейное отношение

IQLevel Level D --> 1   Level B --> 2     Level A --> 3
    Level C --> 4

enter image description here

Смена номинального значения на числовое значение влияет на прогноз линейной регрессии?

...