Я использую Python для построения графика данных (исходя из многих экспериментов), и я хотел бы использовать boxplot
метод pandas
библиотеки.
Выполнение df = pd.DataFrame(value,columns=['Col1'])
результат следующий:
Проблема в крайних значениях. В Matlab решением является использование опции «DataLimit»:
boxplot(bp1,'DataLim',[4.2,4.3])
Из документации Matlab:
Пределы данных и максимальные расстояния
'DataLim' - экстремальные пределы данных
[-Inf, Inf] (по умолчанию) | двухэлементный числовой вектор
Экстремальные пределы данных, заданные в виде разделенной запятыми пары, состоящей из DataLim и двухэлементного числового вектора, содержащего нижний и верхний пределы соответственно. Значения, указанные для DataLim, используются ExtremeMode для определения экстремальных точек данных.
Есть ли что-то похожее для Python?
Walkaround :
Однако я прогуляюсь (, который мне действительно не нравится , потому что это меняет статистическое распределение измерений): я просто исключаю "проблемные значения" вручную:
df = pd.DataFrame(value[100:],columns=['Col1'])
df.boxplot(column=['Col1'])
и результат:
Это потому, что я знаю, где проблема.