R Как вычесть миллион (слово) из чисел в таблицах - PullRequest
0 голосов
/ 23 марта 2019

Я пытаюсь получить чистый бюджет из других территорий в бюджет, вычитая https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films#Critical_response при кассовых показателях

Я предпочитаю не использовать библиотеку, если мне это не нужно, потому что яновичок

Есть проблемы.'$' в колонках брутто и бюджет.В бюджете даже «миллион».

Я попытался gsub избавиться от слов «миллион» и «$» и сделал их числовыми.

BoxOffice - это таблица «Производительность кассовых сборов»


w=gsub("\\s","",BoxOffice$Budget)
w1=gsub("million",",000,000",w)
w2=gsub("([.])(?:\\d{1})","",w1)

, и я получил [1] "$ 109 000 000" [2] "$ 162 000 000"
[3] "$ 365 000 000"[3]" $ 316–400 000 000 »

BoxOffice $ OtherTerritoryGross [1] $ 519,311,965" [2] "$ 622,674,139"
[3] "$ 1,405,403,694" [3] "$ 2,048,359,754"

Это выглядит неплохо, но когда я попытался вычесть это как


as.numeric(BoxOffice$OtherTerritoryGross) - as.numeric(w2)

, я получил «нечисловой аргумент для двоичного оператора»

Я удалил «$» для обоих с помощью gsub

Я хочу получить [1] "410,311,965 $" [2] "~~" [3] "~~" [4] "1 648 359 754-1 732 359 754" или 1 690 359 754

Для [4]-горяд, я не знаю, какой из них лучше. Но мне нужно составить из них сюжет. Поэтому я думаю, что мне лучше получить средний.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...