R Выберите строку по конечному значению - PullRequest
1 голос
/ 15 марта 2020
data=data.frame("grade"=c(1, 2, 3, 1, 2, 3),
                "class"=c('a', 'a', 'a', 'b', 'b', 'b'),
                "size"=c(1, 1, 2, 2, 2, 1),
                "var"=c('q33', 'q35', 'q39', 'q33', 'q35', 'q39'),
                "score"=c(5, 8, 7, 3, 7, 5))

Если предположить, что я w sh для подмножества данных, чтобы исключить любую строку с 'var', заканчивающимся на '5', как я могу это сделать? Обнадеживающий вывод:

data1=data.frame("grade"=c(1, 3, 1, 3),
                "class"=c('a', 'a', 'b', 'b'),
                "size"=c(1,2, 2, 1),
                "var"=c('q33', 'q39', 'q33', 'q39'),
                "score"=c(5, 7, 3,  5))

Ответы [ 2 ]

3 голосов
/ 15 марта 2020

Мы можем использовать grepl с $, чтобы указать конец строки

subset(data,  !grepl('5$', var))
#   grade class size var score
#1     1     a    1 q33     5
#3     3     a    2 q39     7
#4     1     b    2 q33     3
#6     3     b    1 q39     5

Если нам нужно проверить и первое, и последнее, используйте ^, чтобы указать начало

subset(data, !grepl('^5|5$', var))

В этом случае начальный символ не является ди git, если мы хотим проверить первое вхождение ди git

subset(data, !grepl('\\D+5|5$', var))
0 голосов
/ 15 марта 2020

Как уже упоминалось @Frank, мы можем использовать встроенный endsWith, который требует ввода символов.

subset(data, !endsWith(var, "5"))

#  grade class size var score
#1     1     a    1 q33     5
#3     3     a    2 q39     7
#4     1     b    2 q33     3
#6     3     b    1 q39     5

данные

data <- data.frame(grade=c(1, 2, 3, 1, 2, 3),
                   class=c('a', 'a', 'a', 'b', 'b', 'b'),
                   size=c(1, 1, 2, 2, 2, 1),
                   var=c('q33', 'q35', 'q39', 'q33', 'q35', 'q39'),
                   score=c(5, 8, 7, 3, 7, 5), stringsAsFactors = FALSE)
...