У меня есть искровой фрейм данных (PySpark) с данными для 250 000 клиентов.Теперь я хочу отправить эти данные в HTTPS API (в виде файла JSON).Фактическое решение - использовать пакет запросов Python для отправки данных, который отлично работает для небольшого набора данных.Но для этого мне нужно собрать все данные на одном узле и отправить их оттуда.
Есть ли лучшее решение для этого варианта использования?Могу ли я запустить функцию на каждом узле для сохранения данных в https api?
Большое спасибо Christoph