Я не могу понять результаты независимых тестов двух образцов на моем наборе данных. результаты теста, насколько я понимаю, показывают, что существует значительная разница между средними значениями для двух групп населения, но график KDE показывает, что обе кривые почти полностью перекрываются, обе группы образцов имеют ~ 1000 выборок
t тест:
scipy.stats.ttest_ind(X,Y)
результат:
Ttest_indResult(statistic=2.224749067750489, pvalue=0.02621349938240159)
График KDE:
sns.kdeplot(X, bw=.2)
sns.kdeplot(Y, bw=.2)
График KDE изображений
Я бы ожидал получить результат с высоким значением P, который выражает неудачу теста, чтобы отклонить нулевую гипотезу