Как заменить отсутствующие значения в столбце прогнозом ndarray / model - PullRequest
0 голосов
/ 02 октября 2018

Я хотел бы использовать прогноз модели (скажем, RandomForestRegression), чтобы заменить отсутствующее значение в столбце Age кадра данных.Я проверил, что тип данных прогнозирования модели numpy.ndarray.

Вот что я делаю:

a = RandomForestRegressor()
a.fit(train_data, target)
result = a.predict(test_data)
df[df.Age.isna()].Age.iloc[:] = result

Но это не работает и не может заменить nanзначение.Могу я спросить, почему?

Я видел, как некоторые люди используют тот же метод, но они работают.

1 Ответ

0 голосов
/ 04 октября 2018

Не используйте цепную индексацию.Это явно не рекомендуется в документах.Несоответствие, которое вы можете видеть, может быть связано с несоответствиями копирования и просмотра, как описано в документации.

Вместо этого используйте один вызов pd.DataFrame.loc:

df.loc[df['Age'].isna(), 'Age'] = result

См. Также Индексирование и выбор данных .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...