чтение второго слова каждой строки с использованием искры - PullRequest
0 голосов
/ 19 февраля 2019

Я хочу прочитать / напечатать второе слово в каждой строке.

input - >> люди не такие красивые, как выглядят,
как они ходят или как они говорят.
они такиетолько настолько красивыми, насколько они любят,
так же, как они заботятся, как они делятся.

вывод - >> они они

1 Ответ

0 голосов
/ 19 февраля 2019

Пожалуйста, проверьте это:

    val myDF=spark.read.text("<path>")
    import org.apache.spark.sql._
    import org.apache.spark.sql.types._
    val rdd=myDF.rdd.map(_.mkString("")).map(f=> Row(f.split(" ")(1)))
    val schema:StructType  = (new StructType).add("values",StringType )
    val result=spark.createDataFrame(rdd, schema)
    result.show()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...