Я хочу создать столбец, в котором будут только имена людей в наборе данных. В этом случае я просто хочу получить столбец со значениями John, David, Carey, and David
и NA
для тех, кто либо не человек, либо его нет. Однако я сталкиваюсь с двумя трудностями.
Во-первых, мне нужно отфильтровать все эти строки с заглавными буквами. Потому что они не ЛЮДИ; они ENTITIES.
Во-вторых, мне нужно извлечь слово прямо перед запятой, так как это первое имя.
Так что мне просто интересно, как лучше всего получить новую колонку для имен людей.
воспроизводимый набор данных
structure(list(company_number = c("04200766", "04200766", "04200766",
"04200766", "04200766", "04200766"), directors = c("THOMAS, John Anthony",
"THOMAS, David Huw", "BRIGHTON SECRETARY LIMITED", "THOMAS, Carey Rosaline",
"THOMAS, David Huw", "BRIGHTON DIRECTOR LIMITED")), row.names = c(NA,
-6L), class = c("data.table", "data.frame"))