Я обнаружил Коал от Spark + AI Summit, который приносит панд в Spark.
Насколько я знаю, если мне нужно map
сторонняя функция для Spark DataFrame
, Я должен установить пакет на каждом узле моего кластера Spark.
Это то же самое для Коал? Или мне просто нужно запустить pip install koalas
на моем главном узле и позволить Коаласу и Спарку позаботиться обо всем остальном?
Я не нашел никаких подробностей в Документах Коалы *, кромеpip install koalas
.