корректировка p-значения U-критерий Манна-Уитни в python - PullRequest
0 голосов
/ 21 сентября 2018

У меня есть файл двумерного списка (имя - 'hcl_file').Сокращенная версия файла для наглядности.Вертикальные наблюдения, горизонтальный экспериментальный номер:

ID type First Second Third

gerg    I   0.02695 0    0.00135      0.31312

11P     I   0.02695 0    0.00135      0.31312

112HP   II  0.02695 0    0.00135      0.31312

1454HP  II  0.02695 0    0.00135      0.31312

11544H  III 0.02695 0    0.00135      0.31312

657BF   III 0.02695 0    0.00135      0.31312

785DS   III 0.02695 0    0.00135      0.31312

Я новичок в программировании.Не могли бы вы сказать мне, как я могу вычислить значимость различий между типами I, II, III, а затем выполнить корректировку ЧД (Беннамини и Хохбберга)?Чтобы избежать недоразумений, позвольте мне уточнить, что мы проводим эксперимент для разных групп (I, II, III) и найти для них значение p, но затем мы повторим это для других данных, которые требуют корректировки значения p для множественных сравнений.,Мне трудно делать это в цикле, пожалуйста, посоветуйте направление дальнейшего движения.Мой скрипт:

для строки в hcl_file:

     substrings = (len(line))

, в то время как j <подстроки: </p>

k1 = []         # list of values in I-st group 

k2 = []         II

k3 = []         III

for line in hcl_file:

        if line[1] == 'I':

                v1 = float(line[j])

                k1.append(v1)

        elif line[1] == 'II':

                v2 = float(line[j])

                k2.append(v2)

        elif line[1] == 'III':

                v3 = float(line[j])

                k3.append(v3)



import pandas

from scipy.stats import mannwhitneyu

print(mannwhitneyu(k1, k2))

j += 1

1 Ответ

0 голосов
/ 21 сентября 2018

Если вы собираетесь использовать панд, используйте и панды для загрузки данных.

import pandas
from scipy.stats import mannwhitneyu
hcl_data = pandas.read_table(hcl_file, sep="\t")

print(mannwhitneyu(hcl_data.loc[hcl_data['type'] == "II"], hcl_data.loc[hcl_data['type'] == "III"]))

Я не совсем уверен, какие столбцы вы пытаетесь проверить, поэтому я не могу быть более конкретным,Возможно, вам придется сгладить данные, прежде чем передать их scipy.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...