Я довольно новичок в статистике, и я, кажется, не могу обернуть голову вокруг того, что, вероятно, очень простой c вопрос / ответ.
Это наглядное пособие о том, что я пытаясь сделать:
![data in 1D , in groups](https://i.stack.imgur.com/mwdN6.png)
Вы можете видеть, что я разделил мои точки данных на сегменты (/ кластеры) в 1D.
Мне нужно определить, что с учетом новой точки (например, зеленой точки), какова вероятность того, что она принадлежит каждому из сегментов? Я знаю, что могу сделать это, просто используя количество стандартных отклонений от среднего значения для каждого сегмента, но я хотел более нормализованный подход, чтобы получить значение от 0 до 1. Единственная проблема в том, что у меня нет статистические знания, чтобы действительно понять, как это сделать.
Я мог бы впоследствии нормализовать число стандартных заболеваний, но у меня есть ощущение, что это неправильный способ go об этом. И что есть более очевидный метод.
Ответы, которые я видел в Интернете, просто указывают на пакет scipy stats или дают откуда-то формулу копирования-вставки, но на самом деле не объясняют, что происходит или как это работает в понятной форме.