У меня есть фрейм данных с определенными показаниями в качестве индексов (различные типы измерений для данного образца), каждый столбец является образцом, для которого были взяты эти показания.У меня также есть группа лечения, назначенная в качестве имени столбца для каждого образца.Вы можете увидеть пример ниже.
Что мне нужно сделать: для заданных отсчетов (строк) сгруппировать образцы по обработке (имя столбца) и выполнить t-тест (t-тест Уэлча) для каждой группы (каждая обработка).Т-тест должен проводиться для сравнения с одним фиксированным лечением (контрольное лечение).Меня не волнует отслеживание образцов идентификаторов (это было необходимо, теперь я специально их отбросил), я не собираюсь делать парные тесты.
Например, здесь для считывания 1 мне нужно сравнить лечение1против лечения3, лечение2 против лечения3 (нормально, если я тоже получу лечение3 против лечения3).
Пример кадра данных:
frame = pd.DataFrame(np.arange(27).reshape((3, 9)),
index=['readout1', 'readout2', 'readout3'],
columns=['treatment1', 'treatment1', 'treatment1',\
'treatment2', 'treatment2', 'treatment2', \
'treatment3', 'treatment3', 'treatment3'])
frame
Out[757]:
treatment1 treatment1 ... treatment3 treatment3
readout1 0 1 ... 7 8
readout2 9 10 ... 16 17
readout3 18 19 ... 25 26
[3 rows x 9 columns]
Я борюсь с этим уже несколько дней.Попытка распаковать / сложить данные, транспонировать фрейм данных, затем группировать по индексу, удаляя nan и применяя лямбду.Пробовал другие стратегии, но ни одна из них не сработала.Буду признателен за любую помощь.спасибо!