Как я могу получить корреляцию между категориальными и непрерывными переменными? - PullRequest
0 голосов
/ 03 мая 2019

Я хочу получить корреляцию между категориальной переменной и непрерывной переменной.

Я использовал np.corrcoef, чтобы посмотреть на вопрос stackoverflow и попытаться сделать то же самое. Однако корреляция заключается в том, чтобы увидеть взаимосвязь между x и y путем подбора данных. Интересно, имеет ли смысл выводить корреляцию y ( числовая переменная ) после замены x ( категориальная переменная ) на фиктивную переменную.

Например, категориальная переменная, называемая типом огня, имеет четыре категории: тип A, тип B, тип C, тип D, а y - числовая переменная, называемая рабочей силой пожарного, и используется np.corrcoef.

В результате коэффициент корреляции между типом А и рабочей силой пожарного составляет -0,2.

При анализе этих данных были ли получены значимые результаты?

1 Ответ

0 голосов
/ 03 мая 2019

Точечная бизерианская корреляция - это корреляция, которая может отражать связь между непрерывными и категориальными признаками.

В Python вы можете использовать:

from scipy import stats
stats.pointbiserialr(x, y)
...