Сначала я создал текстовый файл с предоставленными вами данными и поместил его в папку HDFS в temp / data.txt
data.txt:
alpha hello,beta! how are you?
beta I am fine alpha.How about you?
alpha I am also doing fine...
alpha Actually, beta, I am bit busy nowadays and sorry I hadn't call U
Затем я создалcase, прочитайте в файле и обработайте его во фрейме данных:
case class PersonMessage(Person: String, Message: String)
val df = sc.textFile("temp/data.txt").map(x => {
val splits = x.split("\t")
PersonMessage(splits(0), splits(1))
}).toDF("Person", "Message")
df.show
+------+--------------------+
|Person| Message|
+------+--------------------+
| alpha|hello,beta! how a...|
| beta|I am fine alpha.H...|
| alpha|I am also doing f...|
| alpha|Actually, beta, I...|
+------+--------------------+