Рассмотрим общий вызов writeStream
- с типичным «консольным» форматом вывода:
out.writeStream
.outputMode("complete")
.format("console")
.start()
Какие есть альтернативы?Я заметил, что на самом деле по умолчанию равно parquet
:
В DataStreamWriter
:
/**
* Specifies the underlying output data source.
*
* @since 2.0.0
*/
def format(source: String): DataStreamWriter[T] = {
this.source = source
this
}
private var source: String = df.sparkSession.sessionState.conf.defaultDataSourceName
В SQLConf
:
def defaultDataSourceName: String = getConf(DEFAULT_DATA_SOURCE_NAME)
val DEFAULT_DATA_SOURCE_NAME = buildConf("spark.sql.sources.default")
.doc("The default data source to use in input/output.")
.stringConf
.createWithDefault("parquet")
Но тогда как путь для указанного файла паркета?Какие другие форматы поддерживаются и какие опции они имеют / требуют?