функция Python для заполнения пропущенных значений с помощью некоторого классификатора, как алгоритм? - PullRequest
0 голосов
/ 13 февраля 2019

Я хотел бы вводить недостающие данные с помощью python "интеллектуальным" способом.

Я пришел к изучению scikit-learn и pandas через "mean" и "median", но я хочу вменения через машинуобучение, статистические алгоритмы, классификаторы ..., чтобы иметь уникальные значения, основанные на значениях всех данных.В основном, как алгоритм обучения классификатора, предсказывающий пропущенное значение (находится в любой части моего набора данных).

Есть что-нибудь подобное?

Ответы [ 2 ]

0 голосов
/ 13 февраля 2019

Есть библиотека fancyimpute, хотя, насколько я знаю, она пока не очень хорошо работает с scikit-learn.В скором времени мы планируем улучшить модели вменения в scikit-learn, в частности, IterativeImputer, кажется, то, что вы ищете: https://github.com/scikit-learn/scikit-learn/pull/11977

0 голосов
/ 13 февраля 2019

Я считаю, что то, что вы ищете, называется интерполяцией.Есть разные методы для этого.

Если вы используете pandas DataFrame для чтения / обработки данных, попробуйте:

pandas.DataFrame.interpolate
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...