У меня есть такой фрейм данных в pyspark.
|--------------|----------------|---------------|
| col_1 | col_2 | col_3 |
|-----------------------------------------------|
| 1 | A | abd |
|-----------------------------------------------|
| 1 | B | acd |
|-----------------------------------------------|
| 1 | A | bcd |
|-----------------------------------------------|
| 1 | B | ceg |
------------------------------------------------|
| 2 | A | cgs |
|-----------------------------------------------|
| 2 | B | bsc |
|-----------------------------------------------|
| 2 | A | iow |
|-----------------------------------------------|
Я хотел бы включить в него таблицу.
|--------------|----------------|---------------|
| col_1 | A | B |
|-----------------------------------------------|
| 1 | abd | acd |
|-----------------------------------------------|
| 1 | bcd | ceg |
|-----------------------------------------------|
| 2 | cgs | bsc |
|-----------------------------------------------|
| 2 | iow | null |
------------------------------------------------|
Как мне это сделать? Функция pivot для фрейма данных pyspark требует агрегатной функции, и в моем случае col_1
также не уникальна.