У меня есть база данных как фрейм данных с именем «data», которая состоит из 500 объектов и 2 переменных. на самом деле
dim(data)
возвращает
[1] 500 2
и
str(data)
возвращает
'data.frame': 500 obs. of 2 variables:
$ Diagnosis : chr "D1" "D2" "D3" "D4" ...
$ Type : Factor w/ 8 levels "T1","T2",..: 6 4 1 6 1 4 4 4 5 5 ...
Но, когда я пытаюсь получитьзначение «Тип» для определенного «Диагноза», скажем, «D4», в дополнение к значению «Тип» появляются 11 странных значений NA. Фактически, кажется, что в каждой ячейке этого фрейма данных есть вектор из 12 значений, из которых 11 являются NA, вышедшими из воздуха. В свою очередь,
data[data$Diagnosis=='D4','Type']
возвращает:
[1] <NA> <NA> <NA> <NA> <NA> <NA>
[7] <NA> <NA> <NA> <NA> <NA> T6
, интересно:
data[data$Diagnosis=='D4',]
, возвращает:
Diagnosis Type
NA <NA> <NA>
NA.1 <NA> <NA>
NA.2 <NA> <NA>
NA.3 <NA> <NA>
NA.4 <NA> <NA>
NA.5 <NA> <NA>
NA.6 <NA> <NA>
NA.7 <NA> <NA>
NA.8 <NA> <NA>
NA.9 <NA> <NA>
NA.10 <NA> <NA>
503 D4 T6
Кадр данных созданв Excel, а затем я импортировал его в R studio, с тех пор я сделал много изменений в фрейме данных.
У меня есть два вопроса:
- Откуда пришли эти NA икак я могу их удалить? На самом деле я хочу, чтобы
data[data$Diagnosis=='D4','Type']
вернул:
[1] T6
и:
data[data$Diagnosis=='D4',]
для повторной настройки:
Diagnosis Type
[row number] D4 T6