Как использовать функцию ранга в dask dataframe? - PullRequest
1 голос
/ 23 октября 2019

Как использовать функцию панд pd.rank() на dask dataframe. Или есть какая-нибудь альтернативная встроенная функция в dask, чтобы сделать то же самое.

1 Ответ

1 голос
/ 24 октября 2019

В настоящее время эта операция не поддерживается. Это трудно сделать параллельно и редко полностью необходимо. Вместо этого вы можете собрать nlargest, а затем вычислить pd.rank для вычисленного результата панд?

В качестве альтернативы, если вы пытаетесь вычислить ранг по столбцам, вы можете использовать map_partitions

df.map_partitions(pd.rank, axis="columns")
...