Сортировка фрейма данных не дает правильного результата в PySpark - PullRequest
0 голосов
/ 28 апреля 2020

Я хочу отсортировать записи по идентификатору продукта в порядке возрастания. Я использовал df= df.orderBy('productID', ascending=True) для сортировки записей.

Пример ввода:

Product ID

10002

1000002A

10003

10004

1000002

В настоящее время я получаю

Product ID


1000002

1000002A

10002

10003

10004

Ожидаемый результат:

Product ID

10002

10003

10004

1000002

1000002A

Не знаю, почему так происходит сортировка. Может кто-нибудь помочь мне решить. Заранее спасибо.

...