Ошибка памяти при умножении двух столбцов на python - PullRequest
0 голосов
/ 21 февраля 2020

У меня есть набор данных, который выглядит следующим образом:

|---------------------|------------------|------------------|
|        Rating       |     Installs     |     Price        |
|---------------------|------------------|------------------|
|          2.1        |      10,000+     |      $8.75       |
|---------------------|------------------|------------------|
|          4.2        |       2,000+     |      $5.99       |
|---------------------|------------------|------------------|
|          3.0        |     50,0000+     |      $3.22       |
|---------------------|------------------|------------------|

Я хочу вычислить общую прибыль (прибыль = Количество установок x) всех приложений, которые имеют рейтинг 3.1 или ниже. Я обрабатываю строки Price и Installs, чтобы получить целочисленные значения, используя следующий код (python -jupyter):

Installs = data.loc[ data['Rating']>=3.1 ]["Installs"]
Price = data.loc[ data['Rating']>=3.1 ]["Price"]
Profit = Installs.apply( lambda row: int( sub(r'[^\d.]', '',row )) ) * Price.apply( lambda row: row.strip('$') )

Но я получаю ошибку памяти с этой командой. Как я могу сделать этот код более эффективным, чтобы он вычислял общую прибыль без каких-либо ошибок памяти.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...