Я новичок в науке о данных
В настоящее время я работаю над оценками студентов.
Это особенности набора данных
1- Gender
2- IQLevel
3- WritingScore
4- MathScore
Примерданные
Мужской уровень C 98 93 Мужской уровень B 62 70 Женский уровень A 81 88 Женский уровень D 53 48
в этом наборе данных Я пытаюсь предсказать оценку по математике на основе других функций
Я использую алгоритм линейной регрессии Python
Для этого мне пришлось преобразовать Gender и IQLevel в числовые значения
Gender : Male --> 1 Female --> 2
IQLevel Level A --> 1 Level B --> 2 Level C --> 3
Level D --> 4
Ожидается, что IQ будет коррелирован с математикой, нов поле IQ мы используем номинальное значение (классификация)
. Таким образом, преобразовав IQLevel в числовой определенным образом, мы можем получить отношение между IQLevel или не
в первом примере
IQLevel Level A --> 1 Level B --> 2 Level C --> 3
Level D --> 4
линейного отношения нет

, но если изменить преобразование в числовое значение другим способом, мы получим линейное отношение
IQLevel Level D --> 1 Level B --> 2 Level A --> 3
Level C --> 4

Смена номинального значения на числовое значение влияет на прогноз линейной регрессии?