Как импортировать данные Qualtrics (в формате csv) в R - PullRequest
0 голосов
/ 13 мая 2018

Я пытаюсь импортировать данные, загруженные из Qualtrics, в R. Это CSV-файл.

enter image description here

Однако я сталкиваюсь с двумя проблемами.

  1. R не может самостоятельно определить формат каждого столбца,вероятно, потому что строка 2 и строка 3 (выделено выше) - бесполезный текст.R считает, что все столбцы character.Тем не менее, очевидно, что некоторые date, некоторые factor, а некоторые integer.Как R может самостоятельно определить класс данных каждого столбца?
library(tidyverse)
filename <- "mydata.csv"
df = read_csv(filename, col_names = TRUE)

Parsed with column specification:
cols(
  .default = col_character()
)
See spec(...) for full column specifications.
Я также пытался загрузить имя переменной (header) и матрицу данных отдельно.К сожалению, использование аргумента skip = 3 не работает.Он говорит, что мои данные имеют только 1 наблюдение ... Почему?
 filename <- "mydata.csv"
 headers = read_csv(filename, col_names = FALSE, n_max = 1)
 df = read_csv(filename, skip = 3, col_names = FALSE)
 colnames(df)= headers
Error in names(x) <- value : 
'names' attribute [273] must be the same length as the vector [1]

Что такое хороший способ импортировать мой CSV-файл в R?

1 Ответ

0 голосов
/ 13 мая 2018

Я использую следующий код для импорта данных из Qualtrics в R:

library(tidyverse)
filename <- "mydata.csv"
headers = read_csv(filename, col_names = FALSE, n_max = 1)
df = read_csv(filename, skip = 3, col_names = FALSE)
colnames(df)= headers

Однако есть одна оговорка. Этот метод работает только при удалении всех разрывов строк при загрузке данных. (см. Приведенный ниже график, чтобы узнать, как это сделать.) Мой аргумент skip = 3 работает, потому что я убрал все разрывы строк при загрузке данных из Qualtrics. Весьма вероятно, что вопросы, которые вы задавали в Qualtrics, содержат несколько строк. Для R это проблема для понимания вашего файла таким образом. Я рекомендую вам удалить все разрывы строк при загрузке данных с сайта.

Используя метод, описанный выше, R обычно может правильно распознать структуру данных большинства столбцов, сэкономив массу усилий для перекодирования.

enter image description here

...