Я новичок в Data Science и работаю над простым самостоятельным проектом с использованием Google Colab. Я взял данные из файла something.csv
, и столбцы файла зашифрованы с помощью ####
, поэтому я не знаю имен столбцов. Я хочу суммировать все значения последнего столбца этого CSV-файла.
Вот моя попытка решить эту проблему с помощью pyspark
df = spark.read.csv('something.csv', header=True)
Теперь я хочу суммировать значения в столбец 'col'. Я искал другие сообщения от stackoverflow, но не понял, как подвести итог.