Заполните пропущенные значения в зависимости от серии и заполните вторую строку на основе предыдущей или следующей строки в pyspark - PullRequest
0 голосов
/ 14 марта 2020

У меня есть CSV с 4 столбцами. Файл содержит несколько пропущенных строк, основанных на серии.

Входные данные: -

No  A   B   C
1   10  50  12
3   40  50  12
4   20  60  15
6   80  80  18

Выходные данные: -

No  A   B   C
1   10  50  12
2   10  50  12
3   40  50  12
4   20  60  15
5   20  60  15
6   80  80  18

Мне нужен код pyspark для генерации вышеуказанного вывода .

...