Я использую этот набор данных: https://www.kaggle.com/daveianhickey/2000-16-traffic-flow-england-scotland-wales#accidents_2012_to_2014 .csv (в частности, 2012-2014)
Как бы я разбил кадр данных на основе значения столбца на несколько файлов CSV на моих hdfs? Я пытаюсь сгруппировать их по столбцу Accident_Severity.
Это то, что у меня есть:
Я новичок в этом, поэтому извините, если я кого-то раздражаю, Если вам нужна дополнительная информация, пожалуйста, дайте мне знать, и я ее предоставлю!