Есть ли способ сделать частичное совпадение строк в R? - PullRequest
0 голосов
/ 20 марта 2019

У меня есть 2 кадра данных. Первый имеет большее количество строк и один столбец идентификатора "ALP23456" и другие связанные столбцы. Второй имеет меньшее количество строк, а значение идентификатора присутствует в виде комментария «ALP23456 сделано 26 марта». Это свободный текст, и ни один шаблон не может быть расшифрован.

Проблема: я хочу сослаться на столбец идентификатора из Фрейма данных 1 в текстовый столбец Фрейма данных 2, чтобы получить некоторую информацию из Фрейма данных 2. Возникла проблема, поскольку она не является точным соответствием.

enter image description here

enter image description here

Решение, которое я хочу: enter image description here

1 Ответ

0 голосов
/ 20 марта 2019

Я использовал регулярное выражение и объединение двух фреймов данных, как показано ниже:

library(stringr)
library(dplyr)

df2$ID <- str_trim(str_extract(df2$Text, pattern = "Q\\S*|A\\S*"))
df <- left_join(df1, df2, by = "ID")
...