рассмотрим столбец Eye_width:
Index Eye_width
15643 58.5
11873 54.6
4651 62.4
5767 66.3
9787 66.3
15236 54.6
8380 54.6
12254 58.5
13549 70.2
12413 58.5
16194 54.6
12655 62.4
12574 62.4
8922 58.5
9037 62.4
5283 66.3
12616 58.5
10 70.2
11481 58.5
17659 50.7
14220 54.6
11857 62.4
3945 42.9
13495 58.5
15430 54.6
1606 66.3
18423 50.7
20 62.4
12117 66.3
14208 50.7
2180 58.5
17114 62.4
2796 58.5
12716 54.6
5514 66.3
12232 66.3
811 62.4
6631 50.7
15123 58.5
9164 54.6
16615 62.4
13441 58.5
12679 62.4
1781 54.6
3994 58.5
16825 54.6
6120 66.3
3596 66.3
1934 62.4
16273 50.7
Здесь мне нравится знать немного статистической информации, я предпочитаю получать немного информации из них, например:
- Гауссово распределение Столбец 2. Это означает 3. Стандартное отклонение. 4.Важно вероятность появления каждого значения в этом столбце. Примерная вероятность 58,5 равна 0,2, 54,6 равна 0,1 и т. Д. Суммарные вероятности всех значений складываются до 1. 5. Учитывайте, когда кривая распределения Гаусса продолжается вдоль оси x до 3 Стандартные отклонения по оси X с обеих сторон экстраполированы. Сейчас общая площадь составляет 6 стд. Эта область, например, будет покрыта 1000 образцов. Среди этих 1000 шаблонов мне нужна информация, например, 58,5 произошло 155 раз, 50,7 произошло 200 раз и так далее для всех значений. Также информация о том, сколько образцов потребляется для первых 50,7, чтобы произойти. Аналогично для других значений в этом столбце. Это снова понятие вероятности и экстраполяции, но мне нужно знать, как это можно сделать программно