Как я могу получить корреляцию между категориальными данными и непрерывными данными? - PullRequest
0 голосов
/ 07 мая 2019

Я хочу получить коэффициент корреляции между недвоичными категориальными данными и непрерывными данными.Коэффициенты были получены с использованием stats.pointbiserialr и np.corrcoef в скудной, тупой упаковке.

1) Информация о данных.Входная переменная (недвоичные категориальные данные, фиктивная переменная) Переменная «Тип», в этих данных существует всего 4 категории (Тип A, B, C, D).

Выходная переменная (непрерывная переменная)

2) Результат (с использованием np.corrcoef) Коэффициент корреляции между переменными.Тип A и Выход: 0,221, Тип B и Выход: -0,688, Тип C и Выход: 0,761, Тип D и Выход: 0,332

Итак, мой вопрос: 1) Понимаете ли вы, что когда Тип A,Выход на 0,221 больше, чем в среднем?2) В зависимости от результатов типа A и типа B, можно ли предположить, что B в 3 раза больше среднего?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...