Проверьте, нормально ли распределены данные - probplot - PullRequest
0 голосов
/ 02 марта 2020

Рассмотрим следующие данные, которые я получил из измерения:

x = array([2.57142857, 2.6, 2.62857143, 2.65714286, 2.68571429,
   2.71428571, 3])

Используя пакет # prob-scale #, я могу графически проверить, нормально ли распределяются данные:

from matplotlib import pyplot
import probscale

fig, ax1 = pyplot.subplots(figsize=(7, 4), ncols=1, sharex=True)
common_opts = dict(
    probax='y',
    datalabel='Income [€]',
    scatter_kws=dict(marker='.', linestyle='none')
)


fig = probscale.probplot(x, ax=ax1, plottype='prob',
                         problabel='Standard Normal Probabilities',  **common_opts)

Данные обычно распределяются, если синие точки l ie на прямой линии. Для приведенного выше примера это не так, есть выброс. Я хочу подчеркнуть этот факт, рисуя наиболее подходящую прямую линию через синие точки на пробплоте, чтобы можно было визуально увидеть, что точки не l ie на прямой линии.

Я не знаю, как включить эту прямую в пробплот.

-> enter image description here

...