Question

Как использовать функцию панд pd.rank() на dask dataframe. Или есть какая-нибудь альтернативная встроенная функция в dask, чтобы сделать то же самое.

MRocklin · Answer 1 · 24 октября 2019

В настоящее время эта операция не поддерживается. Это трудно сделать параллельно и редко полностью необходимо. Вместо этого вы можете собрать nlargest, а затем вычислить pd.rank для вычисленного результата панд?

В качестве альтернативы, если вы пытаетесь вычислить ранг по столбцам, вы можете использовать map_partitions

df.map_partitions(pd.rank, axis="columns")

Как использовать функцию ранга в dask dataframe?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как использовать функцию ранга в dask dataframe?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы