Мой фрейм данных состоит из учетных переменных и фиктивной переменной, которая позволяет мне идентифицировать два типа компаний.
Я хотел бы выполнить t-тест для каждого столбца моего информационного кадра, чтобы сравнить средние значения переменных для двух типов компаний.
На данный момент я разделил свой df на два разных df на основе фиктивной переменной и запустил следующий код:
for column_type1, column_type2 in zip(df_type1.columns[1:],df_type2.columns[1:]):
print(ttest_ind(column_type1,column_type2, equal_var=False, nan_policy='omit'))
Однако я получаю следующую ошибку:
TypeError: невозможно выполнить уменьшение с гибким типом
Если вы знаете, как решить эту проблему или у вас есть лучший способ сделать это, ваша помощь более чем приветствуется!
Спасибо
**** РЕДАКТИРОВАТЬ И РЕШЕНИЕ ****
Я пришел с моей проблемой и вот ее код.
for column_type1, column_type2 in zip(df_type1,df_type2):
print(ttest_ind(df_type1[column_type1],df_type2[column_type2], equal_var=False, nan_policy='omit'))