Рассмотрите возможность группировки столбца и выбора строк на основе других столбцов в R - PullRequest
0 голосов
/ 17 декабря 2018

Мои данные - это фрейм данных (fpo):

     damIDpoG4 damSirepoG4 damGpoG4 damPhenpoG4 damTBVpoG4 damGBVpoG4
[1,]    450622      430878        4    5.540501   4.260957   3.422568
[2,]    450623      430878        4    3.046358   4.169094   3.528200
[3,]    450625      430878        4    4.515801   4.543196   3.843761
....
[50,]    450626      470878        4    4.798896   4.501067   3.875034
[51,]    450630      470878        4    4.282659   4.388037   3.830042
[52,]    450632      470878        4    3.553223   4.086484   3.571130

Я хочу выбрать n номеров (например, 12) из ​​ damIDpoG4 для аналогичной группы damSirepoG4 согласно MAX и / или 20% damGBVpoG4 . damSirepoG4 содержит 250 групп идентичных номеров, которые я пробую:

fpo %>% group_by(fpo[,2]) %>% sample_n(12)

, но мой ответ неверен.Я не мог считать макс или процент за dplyr
спасибо за внимание

1 Ответ

0 голосов
/ 17 декабря 2018

Нам нужно передать имя столбца в group_by (при условии, что 'fpo' равно data.frame/tbl_df, а не matrix)

fpo %>% 
    group_by(damSirepoG4) %>%
    sample_n(12)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...