У меня есть таблица как таковая
+------+------------+-------+
| Idx | date | value |
+------+------------+-------+
| A | 20/11/2016 | 10 |
| A | 21/11/2016 | 8 |
| A | 22/11/2016 | 12 |
| B | 20/11/2016 | 16 |
| B | 21/11/2016 | 18 |
| B | 22/11/2016 | 11 |
+------+------------+-------+
Я хотел бы создать столбец, который создает новый столбец 'Rolling_quantile_value' на основе столбца 'значение' , который вычисляет квантиль на основе прошлого для каждой строки и каждого возможного Idx.
Для приведенного выше примера, если выбран квантиль медиана, выходные данные должны выглядеть следующим образом:
+------+------------+-------+-----------------------+
| Idx | date | value | rolling_median_value |
+------+------------+-------+-----------------------+
| A | 20/11/2016 | 10 | NaN |
| A | 21/11/2016 | 8 | 10 |
| A | 22/11/2016 | 12 | 9 |
| A | 23/11/2016 | 14 | 10 |
| B | 20/11/2016 | 16 | NaN |
| B | 21/11/2016 | 18 | 16 |
| B | 22/11/2016 | 11 | 17 |
+------+------------+-------+-----------------------+
Я сделал это наивным способом, когда я просто поместил функцию, которая создает строку за строкой на основе строк значений прецедентов и помечает переход от одного идентификатора к другому, но я уверен, что это не самый эффективный способ делай это, ни самое элегантное.
Ждем твоих предложений!