У меня есть таблица, и после того, как появляется первое число, число нужно повторить, заполните все столбцы после
. Вот пример таблицы:
student_id 2016Q1 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3
1 1
2 1
3 1
4 1
5 1
6 1
7 1
Яиспользуя pyspark и Python.Я пытаюсь сделать это вручную в Excel, но это слишком много ручного редактирования.Интересно, может ли какая-либо функция в pyspark или pyspark.sql сгенерировать следующую таблицу?Спасибо!
Я ожидаю, что результат будет выглядеть следующим образом
student_id 2016Q1 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3
1 1 1 1 1 1 1
2 1 1 1 1 1 1 1
3 1 1 1 1 1
4 1 1 1
5 1 1 1
6 1 1
7 1 1 1