Я хочу использовать программирование R для статистической корреляции с 3 полями - PullRequest
0 голосов
/ 11 июля 2020

Я буду sh, чтобы выяснить, есть ли корреляция между оценками благополучия персонала (выражается в%) для разных компаний между численностью персонала компании (это число c) и тем, как регулирующий орган рассматривает компанию ( требует улучшения, хорошего и выдающегося). Может кто-нибудь сказать мне, какой статистический анализ был бы полезен и код R, пожалуйста? Спасибо

Вот мои данные :

  Company health and wellbeing score Head Count    Regulator ranking
1       A                        89%       5000                 good
2       b                        70%       3000 requires improvement
3       c                        55%        400          outstanding
4       d                        44%       2000          outstanding

1 Ответ

0 голосов
/ 11 июля 2020

Добро пожаловать в сообщество! Это относится к CrossValidated, но я попробую.

Если это все ваши данные, вы не можете проводить статистический анализ по ним. Недостаточно данных. Если у вас было достаточно данных, все еще есть некоторые проблемы. Корреляция Пирсона не работает с категориальными переменными, для моделей probit / lo git требуется двоичная зависимая переменная. Вы всегда можете перекодировать зависимую переменную. Линейная вероятностная модель даст предвзятый ответ и никогда не рекомендуется для категоричных вопросов. Существуют многомерные пробит-модели, но они немного сложнее. Честно говоря, я бы, вероятно, остановился на некоторых перекрестных таблицах здесь и попытался проверить с помощью пробита (после перекодирования).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...