Я хочу получить коэффициент корреляции между недвоичными категориальными данными и непрерывными данными.Коэффициенты были получены с использованием stats.pointbiserialr и np.corrcoef в скудной, тупой упаковке.
1) Информация о данных.Входная переменная (недвоичные категориальные данные, фиктивная переменная) Переменная «Тип», в этих данных существует всего 4 категории (Тип A, B, C, D).
Выходная переменная (непрерывная переменная)
2) Результат (с использованием np.corrcoef) Коэффициент корреляции между переменными.Тип A и Выход: 0,221, Тип B и Выход: -0,688, Тип C и Выход: 0,761, Тип D и Выход: 0,332
Итак, мой вопрос: 1) Понимаете ли вы, что когда Тип A,Выход на 0,221 больше, чем в среднем?2) В зависимости от результатов типа A и типа B, можно ли предположить, что B в 3 раза больше среднего?