Почему я получаю «не определено из-за особенностей»? - PullRequest
0 голосов
/ 30 апреля 2019

Итак, я провожу анализ выживания в моем наборе данных загрузок Google Playstor.Однако мой анализ с использованием Survreg дает мне только nas для коэффициентов.

"(5 не определено из-за особенностей)"

Если я использую нормальную регрессию lm, эта проблемане происходит.Однако это не сработает, поскольку все наблюдения зависимой переменной подвергаются цензуре справа для другого числа (числовое значение также является пределом).

Мой исходный набор данных: https://www.kaggle.com/lava18/google-play-store-apps

Так что здесьЯ покажу вам весь мой код.Это может быть немного долго, так что прокрутите до конца для анализа выживания, но я хотел дать вам возможность полностью понять.

library(readxl)
Dataset <- read_excel("Thesis/googleplaystore.xlsx")
View(Dataset)
#selecteer 500 apps
set.seed(1998)
dataset <- Dataset[sample(nrow(Dataset), 500), ]
View(dataset)
#Lastupdated --> days_since
end <- matrix( c("2018-08-31"), nrow=500, ncol=1, byrow=FALSE)
end <- format(as.Date(end), "%Y/%m/%d")
View(end)
dataset$`Last Updated` <- as.Date(dataset$`Last Updated`,
                       format = "%B %d, %Y")
dataset$`Last Updated` <- format(as.Date(dataset$`Last Updated`), "%Y/%m/%d")
View(dataset)
install.packages('lubridate')
library(lubridate)
elapsed.time <- dataset$`Last Updated` %--% end
View(elapsed.time)
dataset$days_since <- as.duration(elapsed.time) / ddays(1)
View(dataset)
# + verwijdern uit aantal installs
dataset$Install <- gsub("\\+","", dataset$Installs)
View(dataset)
dataset$Install <- gsub(",","", dataset$Install)
# installs en price numeric maken
typeof(dataset$Install)
dataset$Install <- as.numeric(dataset$Install)
View(dataset)
typeof(dataset$Rating)
dataset$Rating <- as.numeric(dataset$Rating)
typeof(dataset$Reviews)
typeof(dataset$Price)
dataset$Price <- gsub("\\$","", dataset$Price)
dataset$Price <- as.numeric(dataset$Price)
typeof(dataset$days_since)

#Tobit Survival analyses
library(help=survival)
library(survival)
dataset$ins_cen <- matrix( c("0"), nrow=500, ncol=1, byrow=FALSE)
typeof(dataset$ins_cen)
dataset$ins_cen <- as.numeric(dataset$ins_cen)
install.packages('tidyverse')
library(tidyverse)
dataset_2 <- dataset %>% filter(!is.na(dataset$Rating))
View(dataset_2)
dataset_2$dum_cen <- ifelse(dataset_2$ins_cen == 0, 0, 1)
dataset_2$dum_fac <- as.factor(dataset_2$dum_cen)
survreg(Surv(Install, ins_cen, type= 'right') ~  Rating + Price + Reviews + days_since,
        dist="gaussian", data = dataset_2)
cor(dataset)
#CRCH
install.packages('crch')
library(crch)
View(dataset)
CRCH <- crch(Install ~ Rating + Price + Size + Reviews +days_since + `Current Ver` + Category, data = dataset, dist = 'gaussian', right = dataset_2$Install)

Я пытался превратить событие в фиктивную переменную и фактор, нооба варианта не работают.Фиктивная переменная ничего не меняет, а факторная переменная выдает ошибку.

Ошибка в сереге (Surv (Install, dum_fac, type = "right") ~ Rating + Price +: выживание в нескольких состоянияхне поддерживается

Спасибо за любую помощь. Извините, если я задаю глупые вопросы, но я все еще учусь и не могу понять свою проблему.

ps Я также пытался решить моюпроблема с использованием crch(), но это приводит к другой ошибке, в которой я не могу обернуться.

Ошибка в optim (par = start, fn = loglikfun, gr = gradfun, method = method,: неконечное значение, предоставленное optim

Редактировать: я заметил, что я оставил символьные переменные в коде crch. Когда это удаляется из формулы, я получаю другую ошибку.

Ошибка в solve.default (hessfun (par)): система вычислительно единственная: число взаимных условий = 7.31468e-142

Код CRCH:

#CRCH
install.packages('crch')
library(crch)
View(dataset)
CRCH <- crch(Install ~ Rating + Price + Reviews +days_since, data = dataset, dist = 'gaussian', left = -Inf, right = dataset_2$Install)
x = Price + Size + Reviews +days_since + `Current Ver` + Category
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...