Просто добавьте к ответу выше, что вы имеете в виду, это сила. В основном, сколько ложных негативов вы дали определенному эффекту и образцу. В вашем случае эффект равен нулю, поскольку они получены из одного и того же распределения, и обратите внимание, что вы провели только один тест, что означает, что все ваши значения в основном отбираются из равномерного распределения.
Сначала вам нужно получить Разница между двумя распределениями, а во-вторых, выполнить этот тест несколько раз, чтобы увидеть количество отклонений. Смотрите пример ниже:
import numpy as np
import pandas as pd
from scipy.stats import ttest_ind
import seaborn as sns
df = pd.DataFrame({'x':np.random.normal(0,2,150),
'y':np.random.normal(1,2,150)})
Теперь у нас есть два столбца, которые имеют разные значения. Мы go через выборку с различными размерами
def subsampletest(da,N):
pull = da.sample(N)
return(ttest_ind(pull['x'],pull['y'])[1])
sampleSize = np.arange(5,150,step=5)
results = np.array([[subsampletest(df,x) for x in sampleSize] for B in range(100)])
Количество отклонений при альфа 0,05 (из 100) на размер выборки, просто:
rejections = np.mean(results<0.05,axis=0)
sns.lineplot(x=sampleSize,y=rejections)