t-тест для столбцов фрейма данных - PullRequest
0 голосов
/ 18 июня 2020

Вот мой фрейм данных:

       Id  Tell  Number 
0       2   Perhaps 2   
1       1   Yes     6
2       1   No      9
3       2   Yes     4
4       2   Yes     7
5       1   No      8
6       1   Yes     15
7       2   Perhaps 2
8       1   No      6
9       2   Yes     2 
import pandas as pd
from pandas import DataFrame
from scipy import stats

# Creating the dictionary
dic = {'ID': [2,1,1,2,2,1,1,2,1,2], 'Tell': ['Perhaps', 'Yes', 'No', 'Yes','Yes', 'No','Yes', 'Perhaps','No', 'Yes'], 'Number': [3,6,9,4,7,8,15,8,6,13]}

# Creating the dataframe
df = pd.DataFrame(dic)

Я хочу иметь возможность выбирать столбцы из моего фрейма данных и проводить независимый t-тест. Я хочу, чтобы столбец ID был переменной группировки, а столбец Number - зависимой переменной. Когда я это делаю, например:

ex=stats.ttest_ind(df['ID'],df['Number']) 
print(ex)

Он печатает p-value = 4.116, что на самом деле не имеет смысла. Когда я использую статистическое программное обеспечение, такое как jamovi, оно дает мне p-значение 0,478.

Пожалуйста, помогите.

1 Ответ

1 голос
/ 18 июня 2020

Для меня он печатает

Ttest_indResult(statistic=-5.379185420933047, pvalue=4.1168498868556256e-05)

Обратите внимание на e-05, это то, что вы, возможно, не заметили.

Я тестировал другим способом, результат был тот же.

...