Question

У меня есть датафрейм (называемый "df") в R, и я создал новый столбец (называемый "col"), который в настоящее время заполнен NA. В df есть еще один столбец, называемый риском, и я упорядочил фрейм данных, чтобы строки с наибольшим риском были наверху.

Я хочу, чтобы в верхних 25% столбцов (то есть с верхним 25% риска) содержалось слово «x», а в остальных 75% - «y». Я думаю, мне нужен цикл for, чтобы сделать это, но кто-то может порадовать меня этим.

G5W · Answer 1 · 17 мая 2018

Вы можете сделать это с помощью ifelse

ifelse(df$risk > quantile(df$risk, 0.75), "x", "y")

Если вы хотите сохранить это в свой data.frame, используйте

df$col = ifelse(df$risk > quantile(df$risk, 0.75), "x", "y")

Манипуляции со столбцами данных, так что верхние 25% строк содержат значение, R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Манипуляции со столбцами данных, так что верхние 25% строк содержат значение, R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов