У меня очень большой CSV-файл, поэтому я использовал spark и загрузил его в фрейм данных spark.
Мне нужно извлечь широту и долготу из каждой строки в CSV, чтобы создать карту фолиума.
с пандами я могу решить мою проблему с помощью цикла:
for index, row in locations.iterrows():
folium.CircleMarker(location=(row["Pickup_latitude"],
row["Pickup_longitude"]),
radius=20,
color="#0A8A9F",fill=True).add_to(marker_cluster)
Я обнаружил, что в отличие от фрейма данных панд, фрейм данных искры не может быть обработан циклом => как зацикливатьсячерез каждую строку dataFrame в pyspark .
, поэтому я подумал, что если я могу создать проблему и разрезать большие данные в таблицы улья, то итерируем их.
Можно вырезать огромный массив данных SPARK в таблицах улья, а затем итерировать строки с циклом?