Понимание Box участков в Seaborn - PullRequest
0 голосов
/ 25 июня 2018

У меня есть следующий фрагмент кода:

sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
ax = sns.boxplot(y=tips["total_bill"])

, который создает следующий сюжет: Демонстрационный график
Я ссылался на эту статью, чтобы понять, каккоробочный график демонстрирует распределение данных.В рамочном графике самая верхняя горизонтальная линия считается максимальной, а самая нижняя горизонтальная линия считается минимальной.Мой вопрос: почему горизонтальная линия не на 50,81, а на 40?Я знаю, что ответ может быть простым, но у меня нет предварительных знаний о коробочном графике, и я ссылался на вышеуказанную статью.

1 Ответ

0 голосов
/ 25 июня 2018

Верхняя горизонтальная линия обычно должна составлять (75-й процентиль + 1,5 IQR) ваших данных, а нижняя - (25-й процентиль - 1,5IQR).Здесь IQR обозначает межквартильный диапазон, который является длиной вашей коробки).На рамочном графике все, что находится за пределами верхнего и нижнего усов, считается выбросами, которые затем помечаются точками на демонстрационном графике.

...