Построение медианы ячеек данных - PullRequest
0 голосов
/ 14 ноября 2018

Я вычислил ячейки моих значений х данных, а также медиану каждой ячейки, соответствующую значению y.Ниже приведен пример моих данных, которые я использовал для вычисления:

  • x значения варьируются от 0 до 1
  • y значения варьируются в любом месте от любого значения, но каждое значение y имеет значение ax, связанное сit

Мой код:

hist1, bins1 = np.histogram(x)
medians_1 = pd.Series(y).groupby(pd.cut(x, bins1)).median()

hist = [129, 126, 94, 133, 179, 206, 142, 147, 90, 185] 
bins = [0.,         0.09999926, 0.19999853, 0.29999779, 0.39999706,
    0.49999632, 0.59999559, 0.69999485, 0.79999412, 0.8999933,
    0.99999265]
medians_1 = [ 14.42145   14.428275  14.427865  14.42535   14.42613 
14.430235 14.441055  14.43472   14.424155  14.4187  ]

Мне интересно, как я могу построить медианные значения для каждого связанного «мусорного ведра»?

Я попытался построить точечный график, но у меня есть только срединные значения, а не какие-либо значения по оси x.Кроме того, я не могу построить медианы по сравнению с исходными значениями x, потому что они не одинакового размера.

1 Ответ

0 голосов
/ 14 ноября 2018

Вы можете построить медиану относительно центров бина. Центр каждой ячейки может быть рассчитан с помощью этого

import numpy as np
bin_center = (np.asarray(bins[1:])+np.asarray(bins[:-1]))/2
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...