Писпарк - распараллеливание - PullRequest
0 голосов
/ 20 ноября 2018

Я хочу разделить свой фрейм данных объемом 1 ТБ на множество фреймов данных после фильтрации и хочу выполнить с ним определенные операции, а затем сохранить их в словаре, используя ключи, используемые для фильтрации.Могу ли я сделать это с помощью RDD или что-то в pyaprk.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...