Простите, если этот вопрос кажется дублирующим, но я не смог найти ответ, который точно соответствует моим требованиям:
У меня есть фрейм данных с z-показателями, названный "df", который структурирован следующим образом:
score_1 score_2 score_3 score_4
1 0.15 0.20 0.81 0.60
2 0.70 0.55 0.84 0.50
3 0.90 0.33 0.54 0.07
Я хотел бы создать новый столбец "z_score_combined", в котором объединены z-оценки каждой строки.
В этом случае z- результаты будут объединены с использованием функции "comb_pvalues" из scipy.stats. Для получения дополнительной информации читайте: https://docs.scipy.org/doc/scipy-0.16.0/reference/generated/scipy.stats.combine_pvalues.html
Функция структурирована следующим образом:
combine_pvalues(z-score-array, method='stouffer', weights=None)
В функции "z-счет" -array "- это массив z-показателей из каждой строки. Например, «array_1» будет массивом z-показателей из строки, индексированной 1 в «df»; т.е. массив_1 = [(0,15, 0,20, 0,81, 0,60)], массив_2 = [(0,70, 0,55, 0,84, 0,50)] и т. д.
Как создать вспомогательную функцию, которая:
- Итерация по строкам кадра данных, "df";
- Создание объекта массива 1D Numpy , "z-score-array";
- Подает массив в функцию: comb_pvalues (z-Score-array, method = 'stouffer', weights = None), для вычисления объединенного z_score;
- Добавляет объединенную z-оценку в новый столбец "z_score_combined" в кадре данных, "df";
- Выводит измененный вариант данных в кадре "df" с новым столбцом объединенных z-оценок.
Заранее спасибо!