Суммирование и подсчет элементов словаря внутри другого словаря с использованием панд - PullRequest
0 голосов
/ 01 сентября 2018

В файле json с большими данными я получил 24 столбца с 700k строками, у одного из столбцов есть словарь внутри, поэтому я выбрал этот столбец ниже:

 dataset = pd.read_json('ecommerce-events - Copia.json', lines=True)
 dataset.loc[dataset['eventType']=="transaction"]

В столбце транзакции есть "цена", хочу суммировать все цены, умноженные на количество, как мне это сделать с пандами?

 'url': 'da7caa77e2729e12b32a9d7d1a324652ce2264a6',
 'referrer': '6e03ee62984224d0c0f08d4b68b819297d7f4d14',
 'order': 5545,        # unique transaction id
 'orderItems': [{      # list of products bought in that transaction
     'product': 16493, # product id
     'price': 19.9,    # product unit price
     'quantity': 1.0   

печать

1 Ответ

0 голосов
/ 01 сентября 2018
def summation(x):
value=x["price"] * x["qun"]
return value

DF = pd.DataFrame ({ "сделка": [[{ "цена": 23, "Qun": 2}], [{ "цена": 25, "Qun": 2}], [{» цена ": 24," Qun ": 2}]]})
df ["summation_value"] = df [["Transaction"]]. apply (лямбда x: суммирование (x [0] [0]), axis = 1)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...