ValueError: не удалось преобразовать строку в число с плавающей точкой.При вменении отсутствующих данных - PullRequest
0 голосов
/ 17 марта 2019

Я работаю над набором данных для жилья в Мельбурне, и во время предварительной обработки я пытаюсь вычислить недостающие данные, используя стратегию Среднее / Среднее. Я пытался использовать Imputer из Sklearn.preprocessing.

imp = Imputer( strategy='mean' )
dataset = imp.fit(dataset)

После запуска я столкнулся с этой ошибкой.

ValueError: не удалось преобразовать строку в число с плавающей точкой: 'Western Metropolitan'

Я знаю, что вменение происходит только в значениях с плавающей запятой, но мне нужно сделать одно из 2:

1) Вводить только значения, отличные от строки в наборе данных

2) Ввод данных со строкой

Я не смог найти какое-либо решение онлайн. Заранее спасибо.

1 Ответ

0 голосов
/ 17 марта 2019

Python не очень хорошо справляется с категориальными переменными.Вам нужно оцифровать все переменные вашей категории, чтобы вменять пропущенные значения.Даже если один столбец является категорией, ошибка выскакивает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...