Заменить на NA справа от самой правой строки строки - PullRequest
0 голосов
/ 07 февраля 2019

У меня есть датафрейм ниже.Мой фактический набор данных имеет 800 столбцов.

Для самого правого столбца 1004 *, содержащего строку abc, я хочу сделать каждое значение в этой строке равным правому этого столбца NA.

Вот пример:

col1 <- as.Date(c('2019-01-01', '2019-01-02', '2019-02-01', '2019-03-01', '09-02-18'))
col2 <- c('jkabc', 'abckee', 'kekdm', 'oeoeo', 'mends')
col3 <- as.Date(c('2019-08-02', '2019-08-01', '2019-08-04', '2019-07-02', '09-03-15'))
col4 <- c('nnnnn', 'kndabc_kd', 'kenabc123', 'werc', 'mendiabc')
col5 <- as.Date(c('2019-12-11', '2019-11-22', '2019-06-12', '2019-09-30', '08-04-18'))
col6 <- c('nnnnn', 'kdekd', 'abc14', 'ekmabckem', 'nekm')

df<-data.frame(col1, col2, col3, col4, col5, col6)

df

        col1   col2       col3      col4       col5      col6
1 2019-01-01  jkabc 2019-08-02     nnnnn 2019-12-11     nnnnn
2 2019-01-02 abckee 2019-08-01 kndabc_kd 2019-11-22     kdekd
3 2019-02-01  kekdm 2019-08-04 kenabc123 2019-06-12     abc14
4 2019-03-01  oeoeo 2019-07-02      werc 2019-09-30 ekmabckem
5 0009-02-18  mends 0009-03-15  mendiabc 0008-04-18      nekm

В некоторых случаях столбцы содержат и не содержат строку abc в значении.Я хочу изменить это на это:

        col1   col2       col3      col4       col5      col6
1 2019-01-01  jkabc         NA        NA         NA        NA
2 2019-01-02 abckee 2019-08-01 kndabc_kd         NA        NA
3 2019-02-01  kekdm 2019-08-04 kenabc123 2019-06-12     abc14
4 2019-03-01  oeoeo 2019-07-02      werc 2019-09-30 ekmabckem
5 0009-02-18  mends 0009-03-15  mendiabc         NA        NA

Ответы [ 2 ]

0 голосов
/ 07 февраля 2019

Вот решение, которое создает логическую матрицу ячеек для установки в NA, а затем делает это.

abc <- grepl("abc", as.matrix(dm))
dim(abc) <- dim(df)
abc <- t(apply(abc, 1, function(x) {
  if (any(x)) {
    min_abc <- min(which(x))
    rep(c(FALSE, TRUE), c(min_abc, length(x) - min_abc))
  } else {
    x
  }
}))
df[abc] <- NA
df
0 голосов
/ 07 февраля 2019

Вот очень уродливое решение.

df = data.frame(t(apply(df, 1, function(x){
  index = grep("abc", x)
  index = index[length(index)]
  if(index > 0){
    if(index != length(x))
    x[(index + 1):length(x)] = NA
  }
x
})))

Проблема здесь в том, что вы теряете форматирование даты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...