Разница между dask pivot_table и pandas pivot_table python - PullRequest
0 голосов
/ 08 октября 2018

Похоже, что мы можем достичь одной и той же цели, используя pivot_table из обеих библиотек, но какая из них более эффективна для большого набора данных?

1 Ответ

0 голосов
/ 08 октября 2018

Определенно Dask.Работа pandas заключается в том, что она обрабатывает все как монолитный блок в памяти и не распараллеливается, в то время как Dask создан для разбиения фрейма данных на куски, которые могут обрабатываться параллельно.

...