Я знаю, что вы можете преобразовать фрейм данных Spark df в фрейм данных Pandas с помощью
df.toPandas ()
Однако это занимает очень много времени, поэтому я узнал о пакете koala в блоках данных, который мог бы позволить мне использовать данные в качестве фрейма данных pandas (например, возможность использовать scikit learn) без фрейма данных pandas. У меня уже есть искровой фрейм данных, но я не могу найти способ превратить его в коаловый.