Заполните отсутствующие данные средней или самой частой строкой - PullRequest
0 голосов
/ 21 октября 2019

Я новичок в R. В моем информационном кадре отсутствуют некоторые данные. Например:

Temperature   Location
  10.2        New York
  13.2        New York
              Toronto
  10           

Я хочу заполнить числовые столбцы средним значением столбца и заполнить нечисловые столбцы наиболее часто встречающейся строкой. В этом случае это будет «Нью-Йорк». Могу ли я получить помощь?

Спасибо!

1 Ответ

1 голос
/ 21 октября 2019

Предполагая, что ваш фрейм данных называется df:

df$Temperature[is.na(df$Temperature)] <-
  mean(df$Temperature, na.rm = T)

df$Location[is.na(df$Location)] <-
  names(sort(table(df$Location), decreasing = T)[1])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...