Я думаю, что это было задано аналогичным образом, но я не могу заставить работать какие-либо предыдущие решения.У меня есть df, который выглядит так:
Year Family Percent
2000 a .11
2001 a .11
2002 a .23
2000 b .45
2001 b .50
2002 b .99
2000 c .25
2001 c .25
2002 c .19
И так около 300 точек данных.Я пытаюсь сделать корреляцию, чтобы определить, оказывает ли население a какое-либо влияние на население b с течением времени, или, для определенных периодов времени (то есть, с 2005-2010 гг. A и b имели отрицательную корреляцию.)
Я посмотрел на матрицы корреляции Пирсона и Спирмена, использовал data.table для ввода каждой группы (cor (df3 ["a"] $ процент, df3 ["b"] $ процент)), попробовал анализ ANCOVA и многое другое.В основном я получаю много ошибок.
Мне кажется, проблема в том, что мои семьи категоричны, а не непрерывны?Когда я изменю их на числовые, r будет пытаться интерпретировать их как непрерывные и добавлять их к любым корреляциям.
Любая помощь приветствуется.