Допустим, у меня есть следующий набор данных:
df <- read.table(header=TRUE, text="
politics_collapse question_id mean_confidence mean_accuracy mean_importance
Democrat arms_manufacturing_company 24.00000 0.0000000 1.000000
Democrat black_panther 48.50000 0.0000000 1.500000
Democrat stranger_things_universe 55.50000 0.2500000 2.500000
Democrat the_office 37.66667 0.6666667 1.666667
Democrat tupac 80.33333 1.0000000 2.000000
Democrat uber_ceo 39.60000 0.8000000 2.600000
Republican arms_manufacturing_company 37.00000 1.0000000 1.000000
Republican black_panther 45.00000 1.0000000 2.000000
Republican stranger_things_universe 33.00000 1.0000000 3.000000")
Я пытаюсь распределить столбец politics_collapse
по столбцам mean_confidence, mean_accuracy, and mean_importance
. Результирующий вывод будет иметь mean_confidence_democrat
, mean_accuracy_democrat
и mean_importance_democrat
... и то же самое для республиканцев.
Так вот так:
df <- read.table(header=TRUE, text="
question_id mean_confidence_democrat mean_accuracy_democrat mean_importance_democrat mean_confidence_republican mean_accuracy_republican mean_importance_republican
arms_manufacturing_company
black_panther
stranger_things_universe
the_office
tupac
uber_ceo
arms_manufacturing_company
black_panther
stranger_things_universe")
Где очевидно, что в каждой строке будут числовые значения.
Я наткнулся на эту виньетку здесь: https://community.rstudio.com/t/spread-with-multiple-value-columns/5378, в которой предлагается использовать совершенно новые «функции поворота», но я не мог понять, как заставить их работать. Я также пытался вложить значения, распространять их и не вкладывать, и не заставлял их работать.