Я хотел бы сделать вычисления для получения 5 лучших ключевых слов в каждой стране и внутри метода, чтобы получить 5 лучших ключевых слов. Можно ли как-нибудь распараллелить SparkSessions?
Теперь я делаю
country_mapping_df.rdd.map(lambda country_tuple: get_top_5_keywords(country_tuple))
def get_top_5_keywords(country_tuple):
result1 = spark.sql("""sample""")
result.write_to_s3
который не работает! Кто-нибудь знает, как заставить это работать?