Я хочу получить корреляцию между категориальной переменной и непрерывной переменной.
Я использовал np.corrcoef
, чтобы посмотреть на вопрос stackoverflow и попытаться сделать то же самое. Однако корреляция заключается в том, чтобы увидеть взаимосвязь между x и y путем подбора данных. Интересно, имеет ли смысл выводить корреляцию y ( числовая переменная ) после замены x ( категориальная переменная ) на фиктивную переменную.
Например, категориальная переменная, называемая типом огня, имеет четыре категории: тип A, тип B, тип C, тип D, а y - числовая переменная, называемая рабочей силой пожарного, и используется np.corrcoef
.
В результате коэффициент корреляции между типом А и рабочей силой пожарного составляет -0,2.
При анализе этих данных были ли получены значимые результаты?