Проблема при создании нового кадра данных, где для каждого идентификатора в столбце 1 я перечисляю 30 идентификаторов в столбце 2, которые имеют самый низкий показатель в столбце 3 - PullRequest
0 голосов
/ 22 апреля 2019

У меня есть фрейм данных с почти 100-метровыми строками, который выглядит как показано ниже - где у меня есть pitch_1 и pitch_2 вместе со счетом, который показывает, насколько близко pitch_1 к pitch_2. Я хотел бы создать отдельный фрейм данных, где у меня есть 4 столбца. В столбце 1 у меня есть уникальное значение pitch_2, во втором столбце я хочу получить список, разделенный запятыми, из 10 значений pitch_1 с наименьшей соответствующей оценкой в ​​euclid_dist. Затем в 3-м столбце следующие 20 и в 4-м столбце следующие 20 после этого.

> head(pitcher_lhb_similarity,10)
     pitch_1   pitch_2 euclid_dist
2  400010-FF 493247-SI    3.631515
3  493247-SL 493247-SI    3.125729
4  349193-FT 493247-SI    4.619143
5  150037-FF 493247-SI    4.137001
6  218596-FF 493247-SI    2.536352
7  218596-SI 493247-SI    1.438356
8  346800-FF 493247-SI    2.410959
9  218596-FS 493247-SI    1.915009
10 346800-FC 493247-SI    3.103196
11 136602-FF 493247-SI    4.305645
...