Я хочу удалить из строки все символы, которые не являются цифрами, знаками минус или десятичными точками.
Я импортировал данные из Excel, используя read.xls
, которые содержат некоторые странные символы.Мне нужно преобразовать их в числовые.Я не слишком знаком с регулярными выражениями, поэтому мне нужен более простой способ сделать следующее:
excel_coords <- c(" 19.53380Ý°", " 20.02591°", "-155.91059°", "-155.8154°")
unwanted <- unique(unlist(strsplit(gsub("[0-9]|\\.|-", "", excel_coords), "")))
clean_coords <- gsub(do.call("paste", args = c(as.list(unwanted), sep="|")),
replacement = "", x = excel_coords)
> clean_coords
[1] "19.53380" "20.02591" "-155.91059" "-155.8154"
Бонус, если кто-то может сказать мне, почему эти символы появились в некоторых моих данных (знаки степени являютсяоригинального листа Excel, но другие нет).