Расшифровка запроса панд на фрейме данных? - PullRequest
0 голосов
/ 24 сентября 2019

Я хочу декодировать этот запрос панд на фрейме данных.

 filter1 = df['customer_planning_group'] == 'G01'
 filter3 = df['calendar_yearweek'].between(201929,201939) 
 filter4 = df['SKU_Name'].isin(un_name)
 final_filter = filter1 & filter3 & filter4
 df[['calendar_yearmonth', 'calendar_yearweek','predictions', 'total_sales_volume']].where(final_filter).groupby('calendar_yearweek').sum()

пока что я понял1. код пытается выбрать строки из фрейма данных, используя несколько фильтров2. а затем выберите несколько столбцов из этого результата3. а затем сгруппировать по этому результату на основе столбца "calendar_yearweek"4. а затем рассчитать сумму в соответствующей группе.
верно ли мое понимание?это правильный способ условного выбора, группировки и выполнения совокупной суммы на кадре данных?Размер кадра данных близок к 1 ГБ, и в ближайшем будущем он может увеличиться до 4 ГБ

как я попал в этот код

Данные на самом деле принадлежат таблице в MySQL, но это былоочень много времени уходит на то, чтобы обработать то же самое с помощью sql.Я перешел к питону, думая, что прочитал весь файл в пандах, и тогда обработка сократит время.сейчас я хочу, чтобы верное мышление было правильным или нет?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...