Матрица корреляции в R с нечисловыми данными - PullRequest
0 голосов
/ 09 октября 2018

Я хочу создать матрицу корреляции, используя cor() для набора данных, называемого «полеты», который содержит как числовые, так и не числовые данные.Я разделил данные, используя createDataPartition().

# create a data partition
flights_sampling_vector <- caret::createDataPartition(flights$delay, p = 0.8, list = FALSE, times = 1)
flights_train <- flights[flights_sampling_vector]
flights_test <- flights[-flights_sampling_vector]

flights_matrix=cor(flights, y=NULL)

Ошибка в cor (flight, y = NULL): 'x' должно быть числовым

Моя принципиальная проблема заключается в том, что функция cor() неразрешить числовые данные

Как создать корреляционную матрицу с данными, которые содержат как числовые, так и не числовые данные?

1 Ответ

0 голосов
/ 09 октября 2018

Я бы проверил dplyr :: select_if () для подстановки числовых столбцов, а затем вычислил матрицу корреляции для этих столбцов.

library(tidyverse)
library(caret)
flights_matrix <- flights %>%
    select_if(is.numeric) %>%
    cor(.)
...