У меня есть фрейм данных с почти 100-метровыми строками, который выглядит как показано ниже - где у меня есть pitch_1 и pitch_2 вместе со счетом, который показывает, насколько близко pitch_1 к pitch_2. Я хотел бы создать отдельный фрейм данных, где у меня есть 4 столбца. В столбце 1 у меня есть уникальное значение pitch_2, во втором столбце я хочу получить список, разделенный запятыми, из 10 значений pitch_1 с наименьшей соответствующей оценкой в euclid_dist. Затем в 3-м столбце следующие 20 и в 4-м столбце следующие 20 после этого.
> head(pitcher_lhb_similarity,10)
pitch_1 pitch_2 euclid_dist
2 400010-FF 493247-SI 3.631515
3 493247-SL 493247-SI 3.125729
4 349193-FT 493247-SI 4.619143
5 150037-FF 493247-SI 4.137001
6 218596-FF 493247-SI 2.536352
7 218596-SI 493247-SI 1.438356
8 346800-FF 493247-SI 2.410959
9 218596-FS 493247-SI 1.915009
10 346800-FC 493247-SI 3.103196
11 136602-FF 493247-SI 4.305645