У меня есть Pyspark DataFrame с двумя столбцами: sendtime и charge_state, если обвинение_state меняется с «выключено» на «включено», начинается новый цикл зарядки.
Теперь я хочу пометить каждый цикл зарядки какдай мне вывод.
Ввод:
+-------------------+------------+
| sendtime|charge_state|
+-------------------+------------+
|2018-03-02 08:00:00| on|
...
|2018-03-02 09:42:32| on|
|2018-03-02 09:42:33| on|
|2018-03-02 09:42:34| on|
|2018-03-02 09:42:35| off|
|2018-03-02 09:42:36| off|
...
|2018-03-02 10:11:12| off|
|2018-03-02 10:11:13| on|
|2018-03-02 10:11:14| on|
...
Выход:
+-------------------+------------+---------------+
| sendtime|charge_state|charge_cycle_ID|
+-------------------+------------+---------------+
|2018-03-02 08:00:00| on| c1|
...
|2018-03-02 09:42:32| on| c1|
|2018-03-02 09:42:33| on| c1|
|2018-03-02 09:42:34| on| c1|
|2018-03-02 09:42:35| off| c1|
|2018-03-02 09:42:36| off| c1|
...
|2018-03-02 10:11:12| off| c1|
|2018-03-02 10:11:13| on| c2|
|2018-03-02 10:11:14| on| c2|
...