Python: T-тест и циклы над столбцами df - PullRequest
0 голосов
/ 24 августа 2018

Мой фрейм данных состоит из учетных переменных и фиктивной переменной, которая позволяет мне идентифицировать два типа компаний. Я хотел бы выполнить t-тест для каждого столбца моего информационного кадра, чтобы сравнить средние значения переменных для двух типов компаний.

На данный момент я разделил свой df на два разных df на основе фиктивной переменной и запустил следующий код:

for column_type1, column_type2 in zip(df_type1.columns[1:],df_type2.columns[1:]):
    print(ttest_ind(column_type1,column_type2, equal_var=False, nan_policy='omit'))

Однако я получаю следующую ошибку:

TypeError: невозможно выполнить уменьшение с гибким типом

Если вы знаете, как решить эту проблему или у вас есть лучший способ сделать это, ваша помощь более чем приветствуется!

Спасибо

**** РЕДАКТИРОВАТЬ И РЕШЕНИЕ ****

Я пришел с моей проблемой и вот ее код.

for column_type1, column_type2 in zip(df_type1,df_type2):
    print(ttest_ind(df_type1[column_type1],df_type2[column_type2], equal_var=False, nan_policy='omit'))

1 Ответ

0 голосов
/ 27 августа 2018
for column_type1, column_type2 in zip(df_type1,df_type2):
print(ttest_ind(df_type1[column_type1],df_type2[column_type2], equal_var=False, nan_policy='omit'))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...