Question

Это общий вопрос для понимания концепции.

У меня есть кадр данных со всеми столбцами, имеющими значения с плавающей запятой (точность варьируется от 2 до 8 цифр).

Я использую GBM для обучения модель. Когда я тренирую свою модель со всеми значениями с плавающей запятой - оценка r2 -0,78

То же самое, когда все столбцы преобразуются в целочисленные значения - оценка r2 -0,72

Почему оценка r2 падает при преобразовании числа с плавающей запятой целое число?

Это что-то очень специфичное c для моих данных или вообще оно должно упасть?

Anurag Reddy · Answer 1 · 27 февраля 2020

Проблема в вашем случае заключается в том, что вы можете потерять разрешение при конвертации в целые числа. Хорошим показателем c будет измерение погрешности квантования или округления ваших входных данных при преобразовании из числа с плавающей точкой в целые числа. Эта ссылка имеет очень простое c объяснение ошибки округления. Ошибка округления может быть полезной метрикой c для сравнения падения точности относительно точности и систем счисления.

int vs Float в регрессионном моделировании

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

int vs Float в регрессионном моделировании

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы