выбор столбцов в соответствии со значениями (20 лучших столбцов для каждой строки) в фреймах данных, которые имеют несколько столбцов при сохранении всех строк - PullRequest
0 голосов
/ 26 апреля 2018

У меня есть датафрейм, созданный пандами, например:

id-t    t1  t2  t3  t4  t5  t6  t7  t8  t9  t10 t11 t12
id1      2  4   2   0   5   4   4   4   5    5  5   5
id2      0  5   4   3   5   5   6   7   7    8  9   9
id3      2  0   5   4   4   3   5   5   6    7  7   9
id4      4  2   0   5   3   3   3   4   4    4  4   4
id5      2  0   2   4   2   4   4   5   5    6  6   7

Мне нужно создать новый фрейм данных, в котором я хочу сохранить все строки, в то время как мне нужно всего 5 столбцов с наибольшей вероятностью (значениями).

order (highest to lowest)   id1 id2 id3 id4 id5
1                           t1  t4  t8  t3  t1
2                           t3  t5  t9  t5  t4
3                           t6  t6  t10 t9  t8
4                           t8  t7  t11 t7  t3
5                           t9  t8  t12 t12 t12

Это означает, что мне нужно знать для каждой строки, какие столбцы имеют, например, 5 самых высоких значений по сравнению с другими столбцами. Порядок меток столбцов (заголовков) важен для меня не точными значениями. Я надеюсь, что смогу правильно объяснить.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...