Я хочу декодировать этот запрос панд на фрейме данных.
filter1 = df['customer_planning_group'] == 'G01'
filter3 = df['calendar_yearweek'].between(201929,201939)
filter4 = df['SKU_Name'].isin(un_name)
final_filter = filter1 & filter3 & filter4
df[['calendar_yearmonth', 'calendar_yearweek','predictions', 'total_sales_volume']].where(final_filter).groupby('calendar_yearweek').sum()
пока что я понял1. код пытается выбрать строки из фрейма данных, используя несколько фильтров2. а затем выберите несколько столбцов из этого результата3. а затем сгруппировать по этому результату на основе столбца "calendar_yearweek"4. а затем рассчитать сумму в соответствующей группе.
верно ли мое понимание?это правильный способ условного выбора, группировки и выполнения совокупной суммы на кадре данных?Размер кадра данных близок к 1 ГБ, и в ближайшем будущем он может увеличиться до 4 ГБ
как я попал в этот код
Данные на самом деле принадлежат таблице в MySQL, но это былоочень много времени уходит на то, чтобы обработать то же самое с помощью sql.Я перешел к питону, думая, что прочитал весь файл в пандах, и тогда обработка сократит время.сейчас я хочу, чтобы верное мышление было правильным или нет?