Почему мой CrossTable не квадратный? Пакет гмоделей в R - PullRequest
0 голосов
/ 24 февраля 2020

Я не знаю, как это могло бы быть не квадратным, но вот мой код.

Это заставляет меня печатать больше, хотя я не думаю, что есть что-то еще, что имеет смысл печатать. В нем отсутствует столбец идентификатора "-11", но не пропущена строка "-11". Он не включает числа из столбца «-11» в итоговом столбце. Хотя, как вы можете видеть, где общая строка и общий столбец пересекаются, общая сумма является правильной.

Любые входные данные будут оценены.

(csv от https://www.kaggle.com/marianna13/starter-particle-identification-from-94dec2e4-9)

library(class)

library(tidyverse)

library(gmodels)

particle <- read_csv("C:/Users/laura_000/Documents/joe/ML with R/pid-5M.csv")

particles <- particle[sample(nrow(particle), 50000), ]

particles_train <- particles[1:45000, 2:7]
particles_test <- particles[45001:50000, 2:7]

particles_train_labels <- particles[1:45000, 1]
particles_test_labels <- particles[45001:50000, 1]


particles_test_pred <- knn(train = particles_train, test = particles_test, cl = particles_train_labels[,1, drop = TRUE], k = round(45000^.5))

CrossTable(x = particles_test_labels[,1, drop = TRUE], y = particles_test_pred, prop.chisq=FALSE)

Вот вывод

   Cell Contents
|-------------------------|
|                       N |
|           N / Row Total |
|           N / Col Total |
|         N / Table Total |
|-------------------------|


Total Observations in Table:  5000 


                                        | particles_test_pred 
particles_test_labels[, 1, drop = TRUE] |       211 |       321 |      2212 | Row Total | 
----------------------------------------|-----------|-----------|-----------|-----------|
                                    -11 |        20 |         0 |         0 |        20 | 
                                        |     1.000 |     0.000 |     0.000 |     0.004 | 
                                        |     0.007 |     0.000 |     0.000 |           | 
                                        |     0.004 |     0.000 |     0.000 |           | 
----------------------------------------|-----------|-----------|-----------|-----------|
                                    211 |      2759 |         0 |        84 |      2843 | 
                                        |     0.970 |     0.000 |     0.030 |     0.569 | 
                                        |     0.901 |     0.000 |     0.044 |           | 
                                        |     0.552 |     0.000 |     0.017 |           | 
----------------------------------------|-----------|-----------|-----------|-----------|
                                    321 |       181 |         8 |        44 |       233 | 
                                        |     0.777 |     0.034 |     0.189 |     0.047 | 
                                        |     0.059 |     1.000 |     0.023 |           | 
                                        |     0.036 |     0.002 |     0.009 |           | 
----------------------------------------|-----------|-----------|-----------|-----------|
                                   2212 |       101 |         0 |      1803 |      1904 | 
                                        |     0.053 |     0.000 |     0.947 |     0.381 | 
                                        |     0.033 |     0.000 |     0.934 |           | 
                                        |     0.020 |     0.000 |     0.361 |           | 
----------------------------------------|-----------|-----------|-----------|-----------|
                           Column Total |      3061 |         8 |      1931 |      5000 | 
                                        |     0.612 |     0.002 |     0.386 |           | 
----------------------------------------|-----------|-----------|-----------|-----------|
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...