Почему моя числовая матрица преобразуется в матрицу символов? - PullRequest
1 голос
/ 23 мая 2019

Я пытаюсь построить прогностическую классификационную модель, используя Бинарную Логистическую Регрессию и Пенализованный LASSO, которые в конечном итоге я сравню обе модели. Дело в том, что я пытаюсь лучше понять данные и запустить некоторые тесты, прежде чем применять модели, такие как тест мультиколлинеарности, но типы данных конвертируются неправильно.

Набор данных состоит из числовых и факторных переменных. Я импортировал данные в r из файла csv и перед импортом данных вручную изменил все переменные, которые были «факторами», на «числовые». Я специально выбрал, какие столбцы я хочу из всего набора данных, но когда это будет сделано, матрица должна быть числовой с использованием as.matrix, но это не так.

Data<- read.csv("Test.csv")
names(Data)
attach(Data)
dim(Data)
sapply(Data,class)
ChurnFlag <- ifelse(ChurnedFlag=="Y",1,0)

#combinding all the new created variables
DataMat <- as.matrix(cbind(Data,ChurnFlag))

#selecting specifically which variables I want to analyse which are all 
numeric/integer
DataMatRed <- as.matrix((DataMat[,c(4:8,10:73,92)]))

DataMatRedNum <- mapply(DataMatRed,FUN=as.numeric) 
#defining the matrix as numeric
is.numeric(DataMatRedNum) #checking that it is numeric

DataMatDF <- as.data.frame(DataMatRed)
DataMatDF2 <- data.frame(DataMatRed,row.names = NULL,check.rows = FALSE,check.names = TRUE) /*

Я ожидаю, что числовая матрица не является символом, потому что при попытке запустить функцию colldiag в R она не работает, и ошибка выглядит следующим образом:

Ошибка в SVD (X): бесконечные или отсутствующие значения в 'x'

и я проверил, нет ли у меня пропущенных значений и нет ли пропущенных значений

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...