Рассмотрим простой пример:
data_frame(truth = c(1,1,0,0),
prediction = c(1,0,1,0),
n_obs = c(100,10,90,50))
# A tibble: 4 x 3
truth prediction n_obs
<dbl> <dbl> <dbl>
1 1 1 100
2 1 0 10
3 0 1 90
4 0 0 50
Я бы хотел передать это tibble
на caret::confusionMatrix
, чтобы у меня были все необходимые метрики за раз (accuracy
, recall
,и т.д.).
Как видите, tibble
содержит всю информацию, необходимую для вычисления статистики производительности.Например, вы можете видеть, что в наборе тестовых данных (недоступном здесь) есть 100 наблюдений, в которых предсказанная метка 1
соответствует истинной метке 1
.Однако наблюдения 90
с прогнозируемым значением 1
были фактически ложными срабатываниями.
Я не хочу вычислять все метрики вручную и хотел бы прибегнуть к caret::confusionMatrix()
Однако это оказалось на удивление трудным.Вызов confusionMatrix(.)
на tibble
выше не работает.Здесь есть какое-нибудь решение?
Спасибо!