Как ggplot
определяет, является ли переменная непрерывной или дискретной?
Я пишу функцию для ее идентификации, но ggplot
делает это хорошо.Как выглядит функция, которая выполняет это в ggplot
?
Я пытаюсь написать общую функцию, в которой мы предоставляем только данные, а функция должна приближаться к тому, какие переменные дискретны, а какие непрерывны ...
Моя основная функция выглядит следующим образом: мы предоставляем Dataframe и максимальное количество уникальных значений
Classify_numeric <- function(DF = DATA, n_unique) {
for (i in 1:ncol(DF)) {
if (is.numeric(DF[ , i])) {
print(colnames(DF)[i])
if (length(unique(DF[ ,i])) <= n_unique) {print("Discrete")}
else {print("Continuous")}
}
}
}
Classify_numeric(A, n_unique = 30) # this parameter can be change to whatever or we can
# write it that n_unique can be some % of lenght of Dataframe
и ту же функцию только с is.factor
function
Classify_factor <- function(DF = DATA, n_unique) {
for (i in 1:ncol(DF)) {
if (is.factor(DF[ , i])) {
print(colnames(DF)[i])
if (length(unique(DF[ ,i])) <= n_unique) {print("Klasifikovatelny")}
else {print("NEklasifikovatelny")}
}
}
}
Classify_factor(A, n_unique = 20)