У меня есть список, скажем,
ids = ['K50', 'K51', 'K51', 'P41', 'P41', 'P42']
Что мне нужно достичь -
- Взять каждый идентификатор из списка
- Получить данные изтаблица кустов (например, tableA) для каждого сайта.
- Поверните некоторые значения для этих данных.
- Запись в файл паркета для каждого идентификатора.
Примечание. Мне нужно выполнять это задание параллельно для каждого идентификатора в списке.
Я просмотрел несколько постов, но не нашел конкретного решения.Как я могу решить эту проблему в pyspark?
Версия Spark - 2.4.3