Вероятно, это быстрый вопрос, на который я просто не нашел правильных ключевых слов, чтобы получить ответ.
Я использую R studio и импортирую CSV, используя readr
(или xlsx с readxl
) большого набора эпидемиологических данных (> 40 тыс. строк,> 200 переменных), который был предоставлен мне.
library (readr)
DF <- read_csv("com16_NA.csv", na = "999")
## OR ##
library(readxl)
DF <- read_excel("com16_NA.xlsx", na = "999")
Я пытаюсь установить недостающие значения при импорте, однако создатели установили недостающие заполнители как 99 для некоторых переменных, 999 для других (где 99 - допустимый параметр, например, вес), и снова9999 для других (где 999 возможно).
Есть ли способ импорта, чтобы установить пропущенные значения для каждого столбца?Прямо сейчас я вижу только, как установить одно значение как отсутствующее для всего набора данных (согласно приведенному выше коду).
Или лучше всего конвертировать все отсутствующие заполнители в NA
вэлектронную таблицу перед импортом?
Спасибо