Так что в настоящее время я обновляю счетчик строка за строкой в pandas df, и я не думаю, что это самый быстрый способ сделать что-либо.
Ниже приведена упрощенная версия df, которую я используюУ меня есть два счетчика С1, считающие каждый день категории "S", и С2, подсчитывающие каждый раз, когда он переключается на "S" с "N", но не с "B" на "S", если только он не с "N" на "B", чтобы"S".
Это делается с помощью циклов for и if, но довольно медленно работает с 1,7 миллионами строк.Я проделал немалый поиск и, похоже, не могу найти более подход «панды / нуди».
Любые идеи или указатели в правильном направлении будут высоко оценены.
Date Category C1 C2
1/1/2015 N 0 0
1/2/2015 N 0 0
1/5/2015 S 1 1
1/5/2015 S 2 1
1/6/2015 S 3 1
1/6/2015 S 4 1
1/7/2015 N 4 1
1/7/2015 N 4 1
1/12/2015 N 4 1
1/12/2015 N 4 1
1/13/2015 N 4 1
1/13/2015 S 5 2
1/15/2015 S 6 2
1/15/2015 B 7 2
1/16/2015 S 8 2
1/16/2015 S 9 2
1/16/2015 N 8 2
1/21/2015 N 8 2
1/21/2015 S 9 3
1/22/2015 S 10 3