Pandas Datframe sort_values ​​для двоичных данных - PullRequest
0 голосов
/ 04 мая 2019

Я новичок в пандах, у меня есть фрейм данных, который я бы сортировал по двоичным данным, чтобы данные были разделены между 0 и 1. Я использую df.sort_values, будет ли df.sort_values сортировать данные каждый раз одинаково?

EDIT: Вот пример фрейма данных, который я использую: enter image description here

Я бы хотел отсортировать данные во втором столбце.

вот код, который я использую:

sort_data = df.sort_values(['Diagnosis'],axis=0,ascending=True)

1 Ответ

2 голосов
/ 04 мая 2019

Быстрый ответ: это зависит от вашего алгоритма сортировки.

Существует стабильный и нестабильный алгоритм сортировки.sort_values поддерживает сортировку слиянием, которая является стабильной, но имеет нестабильный алгоритм по умолчанию (quick sort).Стабильный алгоритм сортировки сохраняет выходные данные элементов с тем же ключом в том же порядке, в котором они были на входе.

Из docs,

вида: {'quicksort', 'mergesort', 'heapsort'}, по умолчанию 'quicksort'

Выбор алгоритма сортировки.Смотрите также ndarray.np.sort для получения дополнительной информации. mergesort - единственный стабильный алгоритм .Для DataFrames этот параметр применяется только при сортировке по одному столбцу или метке.

Поэтому, если вы выберете стабильный алгоритм, он будет сортировать данные таким же образомкаждый раз.Однако полезно знать об ограничениях используемых вами алгоритмов сортировки.Есть несколько хороших источников доступных онлайн.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...