Я учу scala
и dataframe
недавно, и у меня возникла проблема. Это о dataframe
вещах. Это должно быть решено с использованием Scala
и Dataframe
, но НЕ SparkSQL
.
Задача:
Создайте файл csv
с 4 столбцами (человек, класс, предмет, оценка) для школы и поместите несколько случайные данные в CSV, каждый человек должен иметь "Maths", "Engli sh", "Art" и некоторые другие предметы, по крайней мере, есть 3 класса.
Напишите программу Spark для:
чтения файла CSV
показать полную таблицу данных
показать, сколько человек в классе
показать человека и его балл с наибольшим количеством баллов по математике
Я пытался решить его и погуглил, но я пришел к выводу об использовании SQL для его решения, а также SQL - первое решение, данное Google.
Я действительно не знаю, как это сделать с помощью Spark и Dataframe, но НЕ Spark SQL, хотя в руководстве говорилось, что это очень простой вопрос :(
Может кто-нибудь помочь мне с это, как написать пример для меня или дать мне пример? Большое спасибо. Я буду очень признателен.