Изменить разделитель для метода шоу Spark Dataset - PullRequest
0 голосов
/ 12 июля 2019

Мне очень нравится метод .show () для наборов данных, но я работаю с данными, которые распространены по каналу '|' персонажи. Есть ли способ получить другой разделитель? Этот код

import org.apache.spark.sql.{Encoders, SparkSession}
import scala.collection.JavaConverters._
object Junk extends App {
  val spark = SparkSession.builder().appName("Hello, World!").master("local[2]").getOrCreate()
  val dataset = spark.createDataset[String](List("I'm|as|corny", "as|Kansas|in|August").asJava)(Encoders.STRING)
  dataset.show()
  spark.close()
}

дает мне

+-------------------+
|              value|
+-------------------+
|       I'm|as|corny|
|as|Kansas|in|August|
+-------------------+

В то время как я бы предпочел что-то вроде

+-------------------+
☺              value☺
+-------------------+
☺       I'm|as|corny☺
☺as|Kansas|in|August☺
+-------------------+
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...