python - pandas - фрейм данных - многомерная статистика заполнения данных - PullRequest
0 голосов
/ 20 февраля 2020

У меня есть датафрейм со столбцами, учитывающими различные характеристики звезд, и строками, учитывающими измерения различных звезд. (что-то вроде этого)

\ property _______ A _______A_error_______B_______B_error_______C_______C_error ...

star1

star2

star3

...

в некоторых измерениях ошибка для указанного c свойства равна -1,00, что означает, что измерение было ошибочным.

в таком случае я хочу отменить измерение.

в одну сторону сделать это, удалив всю строку (наряду с другими свойствами, ошибка которых не была -1,00)

я думаю, что можно заполнить ошибочное измерение значением, сгенерированным распределением на основе всех других измерений, смысл - учитывая другие свойства, которые в порядке, это свойство должно иметь это значение, чтобы уменьшить ошибку всего набора данных.

есть ли собственное имя для идеи, на которую я ссылаюсь? Как бы вы применили такой алгоритм?

Я студент сольного проекта, поэтому буду очень признателен за ответы, которые также развивают теорию (:

edit

после дальнейшего прочтения, я думаю, что я имел в виду, называется вменением регрессии.

, поэтому я предполагаю, что мой вопрос - как я могу реализовать многомерную линейную регрессию в кадре данных в самый эффективный способ ???

спасибо!

...