Добавить столбец на фрейм данных - PullRequest
0 голосов
/ 17 января 2019

У меня проблема с R, если вы можете помочь.

x <- data.frame("LocationCode" = c("ESC3","RIECAA6","SJHMAU","RIE104","SJH11","SJHAE","RIEAE1","WGH54","RIE205","GSBROB"), "HospitalNumber" = c("701190923R","2905451068","700547389X","AN11295201","1204541612","104010665","800565884R","620063158W","600029720K","1112391223"),"DisciplineName" = c("ESC Biochemistry", "RIE Haematology","SJH Biochemistry","RIE Biochemistry","SJH Biochemistry","WGH Biochemistry","ESC Biochemistry","WGH Biochemistry","SJH Biochemistry","RIE Haematology"))

Из приведенного выше кадра данных я хочу добавить новый столбец (CRN), состоящий из всех строк "HospitalNumber" с 9 цифрами плюс 1буква в конце (например, 701190923R), создайте еще один столбец (TIT) с остальными строками, который не соответствует 1-му критерию

Ответы [ 3 ]

0 голосов
/ 17 января 2019

Вы можете сделать это в базе, используя код

# Identify cases which match 9 digits then one letter
CRMMatch <- grepl("^\\d{9}[[:alpha:]]$", as.character(x$HospitalNumber))
#Create columns from Hospital number among the matches or those that do not match
x$CRN[CRMMatch] <- as.character(x$HospitalNumber)[CRMMatch]
x$TIT[!CRMMatch] <- as.character(x$HospitalNumber)[!CRMMatch]
# clean up by removing the variable created of matches
rm(CRMMatch)

A dplyr версия может быть

library(dplyr)
x <-
  x %>% 
  mutate(CRN = if_else(grepl("^\\d{9}[[:alpha:]]$", as.character(HospitalNumber)),as.character(HospitalNumber), NA_character_),
         TIT = if_else(!grepl("^\\d{9}[[:alpha:]]$", as.character(HospitalNumber)),as.character(HospitalNumber), NA_character_))
0 голосов
/ 17 января 2019

Совершенно аналогично подходу Керри Джексона, но с использованием ifelse в базе R. Я также с самого начала преобразовал ваш x$HospitalNumber из фактора в символ, предполагая, что это именно то, что вам действительно нужно:

x[2] <- as.character( x[ , 2 ] )
x$CRN <- ifelse( grepl( "^\\d{9}[[:alpha:]]$", x$HospitalNumber) , x$HospitalNumber, "" )
x$TIT <- ifelse( x$CRN != "", "", x$HospitalNumber )

дает вам

> x
   LocationCode HospitalNumber   DisciplineName        CRN        TIT
1          ESC3     701190923R ESC Biochemistry 701190923R           
2       RIECAA6     2905451068  RIE Haematology            2905451068
3        SJHMAU     700547389X SJH Biochemistry 700547389X           
4        RIE104     AN11295201 RIE Biochemistry            AN11295201
5         SJH11     1204541612 SJH Biochemistry            1204541612
6         SJHAE      104010665 WGH Biochemistry             104010665
7        RIEAE1     800565884R ESC Biochemistry 800565884R           
8         WGH54     620063158W WGH Biochemistry 620063158W           
9        RIE205     600029720K SJH Biochemistry 600029720K           
10       GSBROB     1112391223  RIE Haematology            1112391223
0 голосов
/ 17 января 2019

Вы можете определить, что вам нужно, с помощью инструкции

library(stringr)
str_which(x$HospitalNumber,"[:digit:][:alpha:]")

и вы получите:

> str_which(x$HospitalNumber,"[:digit:][:alpha:]")
[1] 1 3 7 8 9

Тогда вы знаете, какие позиции вам нужны, а какие нет

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...