Корреляция между 2 непрерывными и 1 категориальной переменной в R - PullRequest
0 голосов
/ 20 февраля 2019

Я думаю, что это было задано аналогичным образом, но я не могу заставить работать какие-либо предыдущие решения.У меня есть df, который выглядит так:

Year  Family  Percent
2000  a       .11
2001  a       .11
2002  a       .23
2000  b       .45
2001  b       .50
2002  b       .99
2000  c       .25
2001  c       .25
2002  c       .19

И так около 300 точек данных.Я пытаюсь сделать корреляцию, чтобы определить, оказывает ли население a какое-либо влияние на население b с течением времени, или, для определенных периодов времени (то есть, с 2005-2010 гг. A и b имели отрицательную корреляцию.)

Я посмотрел на матрицы корреляции Пирсона и Спирмена, использовал data.table для ввода каждой группы (cor (df3 ["a"] $ процент, df3 ["b"] $ процент)), попробовал анализ ANCOVA и многое другое.В основном я получаю много ошибок.

Мне кажется, проблема в том, что мои семьи категоричны, а не непрерывны?Когда я изменю их на числовые, r будет пытаться интерпретировать их как непрерывные и добавлять их к любым корреляциям.

Любая помощь приветствуется.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...