У меня есть датафрейм с колонкой, в которой есть свободные текстовые записи о годах образования. Из записей свободного текста я хочу извлечь все числа и суммировать их.
Пример: data_en $ educationTxt [1] дает "6 начальной школы 10 старших классов"
С помощью следующего кода я могу извлечь оба числа и суммировать их.
library(stringr)
x <- as.numeric(str_extract_all(data_en$education[1], "[0-9A]+")[[1]])
x <- as.vector(x)
x <- sum(x)
Однако в идеале я хотел бы сделать это для всех записей свободного текста (то есть для каждой строки) и впоследствии добавить результаты в кадр данных для каждой строки (то есть в переменную, такую как data_en $ educationNum). Я немного застрял в том, как действовать.