Как обрабатывать пропущенные значения в наборе данных - PullRequest
0 голосов
/ 27 декабря 2018

У меня есть простая проблема классификации, которую я пытаюсь решить через нейронную сеть, используя керасы.Существует числовой набор данных размером 26000 * 17. Но проблема в том, что в наборе данных много пропущенных значений (нулевых значений).Данные достаточно чувствительны, поэтому ни я не могу игнорировать все строки, содержащие нулевые значения, ни заменить нулевые значения в данных средним, средним или любым стандартным числом.Существует также ограничение не использовать вменение KNN для замены отсутствующих записей.Каков наилучший способ обработки такого набора данных?

Ответы [ 2 ]

0 голосов
/ 27 декабря 2018

Лучший способ заменить отсутствующие значения в любом виде числового набора данных - это KNN-Imputation, который заменяет отсутствующие значения с учетом записей соседей.

0 голосов
/ 27 декабря 2018

Я не знаю, насколько важны ваши данные.Кстати, нет такого хорошего способа обработки пропущенных значений.Конечно, вам придется справиться с этим путем нахождения среднего или среднего или с любым стандартным числом (например, 0).Импутация KNN считается лучшим методом, но не знаю, почему существует ограничение не использовать импутацию KNN.

...