Путаница матрица с более чем 500 возможных категориальных результатов в R - PullRequest
0 голосов
/ 24 марта 2019

Я использую наивные байесовские классификаторы, поскольку все мои предикторы и переменные результата категоричны.Попытка предсказать, какой клиент (около 700 различных имен клиентов) купит конкретный продукт.У продуктов есть категорические характеристики - страна происхождения, цвет, размер, реклама и т. Д. Когда я пытаюсь увидеть точность с помощью матрицы путаницы, результаты настолько запутанные и длинные, что я могу это понять.У кого-нибудь есть идея, как визуализировать матрицу путаницы с более чем 500 возможными категориальными результатами?Или, может быть, есть другой способ по-другому визуализировать результаты?

enter image description here

library(e1071)
library(caret)
library(naivebayes)

data <- read.csv("Data.csv")

set.seed(2)
random <- sample(2, nrow(data1), prob = c(0.7, 0.3), replace = T)
data_train <- data[random == 1, ]
data_test <- data[random == 2, ]
data_nb <- naiveBayes(Client.Name ~., data = data_train)
pred_nb <- predict(data_nb, data_test)
confusionMatrix(table(pred_nb, data_test$Client.Name))

1 Ответ

1 голос
/ 24 марта 2019

Предполагая, что ваша матрица имеет числовые значения для точности, вы можете удобно представить ее в виде тепловой карты.Поскольку точность составляет от 0 до 100%, вам даже не нужно ее нормализовать.Для этой цели вы можете использовать пакет ggplot2 или heatmap.2.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...