int vs Float в регрессионном моделировании - PullRequest
0 голосов
/ 27 февраля 2020

Это общий вопрос для понимания концепции.

У меня есть кадр данных со всеми столбцами, имеющими значения с плавающей запятой (точность варьируется от 2 до 8 цифр).

Я использую GBM для обучения модель. Когда я тренирую свою модель со всеми значениями с плавающей запятой - оценка r2 -0,78

То же самое, когда все столбцы преобразуются в целочисленные значения - оценка r2 -0,72

Почему оценка r2 падает при преобразовании числа с плавающей запятой целое число?

Это что-то очень специфичное c для моих данных или вообще оно должно упасть?

1 Ответ

1 голос
/ 27 февраля 2020

Проблема в вашем случае заключается в том, что вы можете потерять разрешение при конвертации в целые числа. Хорошим показателем c будет измерение погрешности квантования или округления ваших входных данных при преобразовании из числа с плавающей точкой в ​​целые числа. Эта ссылка имеет очень простое c объяснение ошибки округления. Ошибка округления может быть полезной метрикой c для сравнения падения точности относительно точности и систем счисления.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...