Да, вы можете объединить их. Вам необходимо знать количество наблюдений, среднее значение и стандартное отклонение для каждого дня. С дисперсией легче работать, чем со стандартным отклонением, поэтому я выражу все остальное в терминах дисперсии. (Стандартное отклонение определяется как квадратный корень из дисперсии.)
Обозначим:
n[i] # observations for day i
m[i] # mean for day i
v[i] # variance for day i
Вам необходимо рассчитать общее количество наблюдений N
и общее среднее значение M
. Это легко:
days = [day1, day2, ..., day_final]
N = sum(n[i] for i in days)
M = sum(n[i] * m[i] for i in days) / N
Общая дисперсия V
является более сложной, но все же может быть рассчитана:
s1 = sum(n[i] * v[i] for i in days)
s2 = sum(n[i] * (m[i] - M)**2 for i in days)
V = (s1 + s2) / N
Выше для дисперсии населения. Если вместо этого вы используете v[i]
в качестве выборочной дисперсии, необходимо внести незначительные изменения в s1
и V
:
s1_sample = sum((n[i] - 1) * v[i] for i in days)
V_sample = (s1_sample + s2) / (N - 1)