Мне было интересно, было ли чистое решение с использованием data.table для решения следующей проблемы, возможно, с использованием других пакетов, таких как stringr.
Предположим, у меня есть следующая таблица данных
DT <- data.table(name = c("Carlos", "Henry", "John"),
ID = c("US115115, CH123232, AB155, US4445", "CH112, BB53", "US57677777"))
Это выглядит так:
name ID
1: Carlos US115115, CH123232, AB155, US4445
2: Henry CH112, BB53
3: John US57677777
Я хочу создать еще один столбец ID2, скажем, чтоберет идентификатор столбца и извлекает только «американские идентификаторы» и создает новый столбец, чтобы итоговая таблица данных выглядела следующим образом:
name ID ID2
1: Carlos US115115, CH123232, AB155, US4445 US115115, US4445
2: Henry CH112, BB53 NA
3: John US57677777 US57677777
и где каждый элемент является строкой.Мне удалось зашифровать версию, в которой она берет первую «американскую идентификацию» и отбрасывает остальные, но я не смогла найти решение, которое обрабатывает множественность.
Любая помощь будет принята с благодарностью!