Манипуляции со столбцами данных, так что верхние 25% строк содержат значение, R - PullRequest
0 голосов
/ 17 мая 2018

У меня есть датафрейм (называемый "df") в R, и я создал новый столбец (называемый "col"), который в настоящее время заполнен NA. В df есть еще один столбец, называемый риском, и я упорядочил фрейм данных, чтобы строки с наибольшим риском были наверху.

Я хочу, чтобы в верхних 25% столбцов (то есть с верхним 25% риска) содержалось слово «x», а в остальных 75% - «y». Я думаю, мне нужен цикл for, чтобы сделать это, но кто-то может порадовать меня этим.

1 Ответ

0 голосов
/ 17 мая 2018

Вы можете сделать это с помощью ifelse

ifelse(df$risk > quantile(df$risk, 0.75), "x", "y")

Если вы хотите сохранить это в свой data.frame, используйте

df$col = ifelse(df$risk > quantile(df$risk, 0.75), "x", "y")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...