в столбце «Набор данных» упомянуто в сокращенном выражении «Миллион и миллиард», как удалить и рассчитать среднее значение этого столбца. - PullRequest
0 голосов
/ 01 июня 2019

В наборе данных столбца «доход» числовое значение упоминается в виде знака $ и сокращенно в миллионах и миллиардах. Как рассчитать среднее значение «Выручки»

enter code here
 B_l$revenue<-split(B_l$revenue, split="M", Split="B")/1000

1 Ответ

0 голосов
/ 01 июня 2019

Можно использовать sub для удаления "B | M" с помощью sub и вычисления mean столбца

mean(as.numeric(sub("B|M", "", B_l$revenue)), na.rm = TRUE)

Или используя parse_number, чтобы извлечь числовую часть и затем получить mean

library(readr)
mean(parse_number(B_l$revenue), na.rm = TRUE)

Не ясно о разделении. Если элементы 'B' должны быть разделены на 1000

i1 <- grepl("B", B_l$revenue)
v1 <- parse_number(B_l$revenue)
v1[i1] <- v1[i1]/1000
mean(v1)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...