Как бы я разделить dask dataframe, основанный на значении столбца, на несколько файлов CSV в моих hdfs? - PullRequest
0 голосов
/ 01 мая 2020

Я использую этот набор данных: https://www.kaggle.com/daveianhickey/2000-16-traffic-flow-england-scotland-wales#accidents_2012_to_2014 .csv (в частности, 2012-2014)

Как бы я разбил кадр данных на основе значения столбца на несколько файлов CSV на моих hdfs? Я пытаюсь сгруппировать их по столбцу Accident_Severity.

Это то, что у меня есть: What i have so far!

enter image description here

Я новичок в этом, поэтому извините, если я кого-то раздражаю, Если вам нужна дополнительная информация, пожалуйста, дайте мне знать, и я ее предоставлю!

...