У меня есть датафрейм со столбцами, учитывающими различные характеристики звезд, и строками, учитывающими измерения различных звезд. (что-то вроде этого)
\ property _______ A _______A_error_______B_______B_error_______C_______C_error ...
star1
star2
star3
...
в некоторых измерениях ошибка для указанного c свойства равна -1,00, что означает, что измерение было ошибочным.
в таком случае я хочу отменить измерение.
в одну сторону сделать это, удалив всю строку (наряду с другими свойствами, ошибка которых не была -1,00)
я думаю, что можно заполнить ошибочное измерение значением, сгенерированным распределением на основе всех других измерений, смысл - учитывая другие свойства, которые в порядке, это свойство должно иметь это значение, чтобы уменьшить ошибку всего набора данных.
есть ли собственное имя для идеи, на которую я ссылаюсь? Как бы вы применили такой алгоритм?
Я студент сольного проекта, поэтому буду очень признателен за ответы, которые также развивают теорию (:
edit
после дальнейшего прочтения, я думаю, что я имел в виду, называется вменением регрессии.
, поэтому я предполагаю, что мой вопрос - как я могу реализовать многомерную линейную регрессию в кадре данных в самый эффективный способ ???
спасибо!