Как выполнить TTest на нескольких колоннах - PullRequest
0 голосов
/ 18 января 2020

Мой фрейм данных ниже

patid age gender    tg0 tg1 tg2 tg3 tg4 wgt0 wgt1 wgt2 wgt3 wgt4
0   1   45  Male    180 148 106 113 100 198 196 193 188 192
1   2   56  Male    139 94  119 75  92  237 233 232 228 225
2   3   50  Male    152 185 86  149 118 233 231 229 228 226
3   4   46  Female  112 145 136 149 82  179 181 177 174 172
4   5   64  Male    156 104 157 79  97  219 217 215 213 214

Это правильный путь, если я сделаю среднее значение tg0 tg1 tg2 tg3 tg4 и wgt0 wgt1 wgt2 wgt3 wgt4, чтобы я получил 2 столбца a и b и провел тестирование

Копирование тематического исследования также

A physician is evaluating a new diet for her patients with a family history of heart disease. To test the effectiveness of this diet, 16 patients are placed on the diet for 6 months. Their weights and triglyceride levels are measured before and after the study, and the physician wants to know if either set of measurements has changed

Нулевая гипотеза: нет разницы в уровнях триглицеридов и весе индивидуума после использования новой диеты в течение 6 месяцев.

Альтернативная гипотеза: существует значительная разница в уровнях триглицеридов и веса индивидуума после использования новой диеты в течение 6 месяцев.

Для 2 переменных мы можем сделать, как показано ниже код

from scipy import stats
#Data of group 1
a = np.array([42.1, 80.0, 30.0, 45.8, 57.7, 80.0, 82.4, 66.2, 66.9, 79.0])
#Data of group 2
b = np.array([80.7, 85.1, 88.6, 81.7, 69.8, 79.5, 107.2, 69.3, 80.9, 63.0])
t2, p2 = stats.ttest_ind(a,b)

Ответы [ 2 ]

0 голосов
/ 02 февраля 2020

Похоже, вы хотите найти разницу до и после 6-месячного периода для каждого типа измерения. Исходя из этого, кажется, что вы хотели бы сделать два отдельных теста:

  1. Значительно ли отличается значение измерения окончательный триглицеридов от измерения начального триглицеридов .
  2. Значительно ли отличается * окончательное значение измерения веса от начального измерения веса

Примечание: я предполагая, что каждый столбец представляет измерение во времени, начиная с 0 и заканчивая 4. Это будет означать, что tg0 и wgt0 являются начальными измерениями триглицеридов и веса соответственно, и что tg4 и wgt4 являются окончательными измерениями

Для каждого теста вы сравниваете окончательное измерение с первоначальным измерением, поэтому вы бы хотели структурировать тесты следующим образом:

t_tg, p_tg = stats.ttest_ind(tg4,tg0)
t_wgt, p_wgt = stats.ttest_ind(wgt4,wgt0)

Затем используйте p_tg и p_wgt, чтобы сделать уникальное определение для триглицеридов и веса.

0 голосов
/ 02 февраля 2020

Я не уверен, почему существует четыре измерения триглицеридов и весов для каждого пациента.

Предполагая, что измерения были сделаны, скажем, с интервалом в один месяц (в то время как на диете и tg0, wgt0 при запуске диеты ) тогда вы можете сделать одно из двух:

  1. Возьмите первое и последнее значения (tg0, tg4) и используйте их в качестве двух групп (a, b). Сделайте то же самое для wgt0 и wgt4.
  2. Чтобы получить более высокую точность, мы можем включить другие значения, подбирая линию наилучшего соответствия уровням триглицеридов каждого пациента. И затем, используя первое значение этой линии наилучшего соответствия как a и последнее как b для каждого пациента. Сделайте то же самое для весов.

Это правильный путь? Если я сделаю среднее значение tg0 tg1 tg2 tg3 tg4 и wgt0 wgt1 wgt2 wgt3 wgt4, чтобы я получил 2 столбца a и b и выполните тестирование

Если (tg0 tg1 tg2 tg3 tg4) являются измерениями до диеты и (wgt0 wgt1 wgt2 wgt3 wgt4) являются измерениями после, и они измеряют то же самое (например, вес), то Вы можете сделать то, что вы предлагаете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...