Панды сгруппированы и применяют функцию к числовым столбцам - PullRequest
0 голосов
/ 11 сентября 2018

Я пытаюсь применить тест shapiro-wilk к моему фрейму данных, который разбит на группы по двум категориальным переменным:

df.groupby(['category 1', 'category 2']).apply(stats.shapiro)

Это приводит к ошибке, говорящей о том, что он не может конвертироватьСтрока, чтобы плавать.Единственные нечисловые столбцы там - это две категории, которые я использую для разделения фрейма данных.

Как это исправить?

РЕДАКТИРОВАТЬ:

пример данных:

cat1    cat2    purchases    sales
A       B       20           25
C       A       30           45
B       B       35           20
A       A       40           50

Я хочу получить статистику Shapiro и значение ap для каждогочисловых столбцов без необходимости записывать все возможные комбинации каждой категории.

1 Ответ

0 голосов
/ 11 сентября 2018

Это должно работать:

df.groupby(['cat1', 'cat2'])['purchases','sales'].apply(stats.shapiro)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...