test_data <- data.frame(event= c("event1","event2","event3","event4","event5","event6","event7"),
rater1_1 = c("red", "orange", "red", "purple", "orange", "red", "yellow"),
rater2_1 = c("red", "orange", "orange", "purple", "orange", "red", "purple"),
rater3_1 = c("red", "red", "yellow", "purple", "orange", "red", "yellow"),
rater4_1 = c("orange", "orange", "blue", "orange", "orange", "red", "purple"),
rater5_1 = c("blue", "blue", "purple", "orange", "orange", "blue", "yellow")
)
с вышеупомянутыми данными, я пытаюсь создать матрицу путаницы, где я могу наблюдать разногласия по всем оценщикам для каждого события. то есть для события 1 3 оценщика дали «красный» и 1 «оранжевый» и 1 «синий».
Я полагаю, что лучший способ приблизиться к этому - взять сравнение каждой пары оценщиков (rater1 по оси y и rater2 по оси x), а затем выполнить итерацию и подсчет по всем парам оценщиков.
я надеюсь на что-то похожее на приведенное ниже:
red orange blue yellow purple
red 22 6 2 3 2
orange 6 13 1 4 1
blue 2 1 10 3 1
yellow 3 4 3 9 2
purple 2 1 1 2 9
(примечание: эти значения составлены, я не подсчитывал вручную выше)
Я даже не уверен, с чего начать. В большинстве матриц путаницы, которые я искал, сравниваются фактические выходные данные модели с прогнозируемыми выходными данными модели (например, link ). Любые предложения будут ценны.