Сравнение строк с R - PullRequest
       0

Сравнение строк с R

0 голосов
/ 22 января 2019

У меня есть два набора данных, которые я хочу связать (inner_join) с общим ключом, который является строкой. Проблема в том, что в одном из двух наборов данных ключ не завершен, но этот неполный ключ включен в другой, как в следующем примере:

key for 1st dataset: PV955--075P412171042-- 
and for the 2nd:     PV955--???P412171042--

??? представляет пропущенные числа, поэтому мой вопрос в том, можем ли мы сделать сравнение строк / включение, чтобы проверить, включены ли символы моего 2-го ключа в мой 1-й ключ, и выполнить объединение для этого, если да?

ИДК, если проблема ясна, и спасибо за ответы.

Ответы [ 2 ]

0 голосов
/ 25 января 2019

В базе R с регулярными выражениями:

key1 <- "PV955--075P412171042--"
key2 <- "PV955--???P412171042--"
key2re <- gsub("--...", "--...", key2)
grepl(key2re, key1)
## [1] TRUE

Замените 3 неизвестных символа после "-" на точки, обозначающие любой символ в регулярных выражениях.Затем проверьте, совпадают ли две строки.

0 голосов
/ 22 января 2019

Трудно ответить, не видя ваших данных, однако вы можете попробовать это:

library(stringr)
> str_detect("075P412171042","P412171042")
[1] TRUE
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...