sns stripplot с просто n верхним числом категорий - PullRequest
0 голосов
/ 10 декабря 2018

У меня есть код, который хорошо отображает sns stripplot:

f, ax = plt.subplots(figsize=(15,12))
sns.stripplot(data = cars, x='price', y='model', jitter=.5)
plt.show()

, но есть слишком много моделей автомобилей, поэтому я хочу визуализировать только топ-n наиболее часто встречающихся моделей автомобилей в наборе данных.Также есть ли лямбда-вычисления или что-то подобное, что я могу применить к price или model без создания отдельного фрейма данных?

Если есть лучшая библиотека визуализации, которая может помочь с этим, не стесняйтесь предлагать.

1 Ответ

0 голосов
/ 11 декабря 2018

Вы можете найти наиболее часто встречающиеся значения столбца с помощью value_counts () .Здесь я выбрал 2 самых популярных модели:

most_occurring_values = cars['model'].value_counts().head(2).index

Затем вы можете отфильтровать исходный кадр данных и выбрать только те строки, которые содержат модели с самой высокой частотой:

cars_subset = cars[cars['model'].isin(most_occurring_values)]

Наконец, используйте это подмножество для построения ваших данных:

f, ax = plt.subplots(figsize=(15,12))
sns.stripplot(data = cars_subset, x='price', y='model', jitter=.5)
plt.show()
...