Попытка предсказать значения nan одного и того же столбца / объекта с помощью линейной регрессии - PullRequest
0 голосов
/ 12 апреля 2020

Я не знаю, что за х и у использовать, так как они должны быть одинаковой длины? Я хочу предсказать значения nan, которые у меня есть, в том же столбце numèri c. С 600 значениями, которые я имею, я хочу предсказать 200 оставшихся, которые являются nans. X, моя независимая переменная, имеет 600 строк, а моя y, зависимая переменная, имеет 200 строк. Всего мой DF имеет 800 строк. как я должен указать свои х и у? X = df ['var']. Loc [df ['var']> 0] y = df ['var']. Loc [df ['var'] == np.nan] Когда я разделяю переменные, я получаю this: ValueError: Найдены входные переменные с непоследовательным количеством выборок: [800, 0]

...