У меня есть фрейм данных с 3 000 000 идентификаторов. Каждый ID имеет диапазон месяцев от 01.01.2015 до 01.12.2018. У каждого идентификатора есть столбцы «A» и «B» со значениями numeri c. Мне нужно создать новый столбец «C :.
Для каждого идентификатора, когда Date == '2015-01-01', который является первым месяцем для этого идентификатора, столбец C значение, равное exp (значение column_A). Для следующего месяца (Date == '2015-02-01') столбец C значение равно exp (log (column_C_value в предыдущем месяце) + column_B_value в этом месяце), поэтому здесь exp (журнал (столбец C @ 2015-01-01) + column_B @ 2015-02-01). Каждый из следующих месяцев имеет тот же шаблон, пока не достигнет 2018-12-01.
In Python, я могу установить l oop для каждого идентификатора и для каждой строки / месяца, например: для идентификатора в диапазоне (xxx): для месяца в диапазоне (xxxx):
Однако такой расчет занимает много времени. Может ли кто-нибудь подсказать мне более быстрый способ сделать этот расчет? Спасибо за вашу помощь!