У меня есть кадр данных, как показано ниже.

Я хочу получить p-значение критерия Манна-Уитни, сравнивая каждый столбец.В качестве примера я попробовал ниже.
from scipy.stats import mannwhitneyu
mannwhitneyu(df['A'], df['B'])
Это приводит к следующим значениям.
MannwhitneyuResult(statistic=3.5, pvalue=1.8224273379076809e-05)
Мне было интересно, повлияло ли NaN
на результат, таким образомЯ сделал следующие df2
и df3
кадры данных, как описано на рисунке, и попробовал ниже.
mannwhitneyu(df2, df3)
Это привело к
MannwhitneyuResult(statistic=3.5, pvalue=0.00025322465545184154)
Итак, ядумаю, что NaN
значения повлияли на результат.Кто-нибудь знает, как игнорировать NaN
значения в кадре данных?
