Визуализируйте числовые и категориальные данные, которые имеют смысл в matplotlib / seaborn - PullRequest
2 голосов
/ 14 января 2020

У меня есть столбец income, который имеет 1000 значений в диапазоне от 10 до 10000, и другой категориальный столбец alcoholic, который является столбцом категории Да / Нет 2. Что и как можно увидеть отношения между ними?

sns.catplot использует stripplot или swarm, который показывает только две прямые линии. Как я могу найти отношения между ними, как в regplot или scatterplot для числовых значений?

1 Ответ

3 голосов
/ 14 января 2020

Я бы использовал сюжет для скрипки или boxplot из библиотеки Seaborn. Вот фрагмент:

import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt

income = list(np.random.normal(4000, 1500, 500)) + list(np.random.normal(7000, 800, 500))
alcoholic = ['no']*500 + ['yes']*500
df = pd.DataFrame({'income':income, 'alcoholic':alcoholic})

sns.violinplot(data=df, x='alcoholic', y='income')

enter image description here

sns.boxplot(data=df, x='alcoholic', y='income')

enter image description here

...