Я полностью новичок в области больших данных, пожалуйста, будьте проще.
Используя Scala Я загрузил файл .txt, содержимое которого выглядит следующим образом: [click] [1]
import scala.io.Source
val lines = Source.fromFile("C:/Users/me/Downloads/myText.txt ").getLines().toList
В любом случае, согласно заданию, я должен получить DataFrame в результате, поэтому я сделал следующее:
lines.toDF()
Результат:
+------------------------------+
|value |
+------------------------------+
|+---+------------------+-----+|
|| id| Text1|Text2||
|+---+------------------+-----+|
|| 1| one,two,three| one||
|| 2| four,one,five| six||
|| 3|seven,nine,one,two|eight||
|| 4| two,three,five| five||
|| 5| six,five,one|seven||
|+---+------------------+-----+|
+------------------------------+
Пока мой цель:
+---+------------------+-----+
|id |Text1 |Text2|
+---+------------------+-----+
|1 |one,two,three |one |
|2 |four,one,five |six |
|3 |seven,nine,one,two|eight|
|4 |two,three,five |five |
|5 |six,five,one |seven|
+---+------------------+-----+
Не могли бы вы предложить мне инструменты / методы для ее достижения?