Похоже, что мы можем достичь одной и той же цели, используя pivot_table из обеих библиотек, но какая из них более эффективна для большого набора данных?
Определенно Dask.Работа pandas заключается в том, что она обрабатывает все как монолитный блок в памяти и не распараллеливается, в то время как Dask создан для разбиения фрейма данных на куски, которые могут обрабатываться параллельно.