Эквивалентно «from_unixtime (bigint unixtime)» в Flink-SQL - PullRequest
0 голосов
/ 06 сентября 2018

Я ищу эквивалент функции from_unixtime (bigint unixtime) , которая существует в Spark-SQL, в Flink-SQL.

Моя цель - преобразовать этот формат: 1439799094

в этом формате: 2015-05-18 05: 43: 37

Ответы [ 2 ]

0 голосов
/ 30 января 2019

Просто используйте UDF!

https://ci.apache.org/projects/flink/flink-docs-stable/dev/table/udfs.html

Пример использования

test.csv

creation_date|key
1535816823|1
1536392928|2
1536272308|3

EpochTimeConverter.scala

import java.time.format.DateTimeFormatter
import java.time.{Instant, LocalDateTime, ZoneId}

import org.apache.flink.table.functions.ScalarFunction

class EpochTimeConverter extends ScalarFunction {
  def eval(epochTime: Int): String = {
    // For performance, you may cache `DateTimeFormatter` in real life
    val timePattern = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")
    timePattern.format(LocalDateTime.ofInstant(Instant.ofEpochSecond(epochTime), ZoneId.systemDefault()))
  }
}

UdfExample.scala

import org.apache.flink.api.scala.{ExecutionEnvironment, _}
import org.apache.flink.table.api.scala._
import org.apache.flink.table.api.{TableEnvironment, Types}
import org.apache.flink.table.sources.CsvTableSource
import org.apache.flink.types.Row

object UdfExample {
  def main(args: Array[String]): Unit = {
    val env = ExecutionEnvironment.getExecutionEnvironment
    val tableEnv = TableEnvironment.getTableEnvironment(env)
    val csvData = CsvTableSource
      .builder()
      .path("test.csv")
      .ignoreFirstLine()
      .fieldDelimiter("|")
      .field("creation_date", Types.INT)
      .field("key", Types.INT)
      .build()

    tableEnv.registerTableSource("temp_table", csvData)

    println("Without udf:")
    tableEnv.sqlQuery("SELECT creation_date, key FROM temp_table").toDataSet[Row].print()

    tableEnv.registerFunction("from_unixtime", new EpochTimeConverter())

    println()
    println("With udf:")
    tableEnv.sqlQuery("select from_unixtime(creation_date),key from temp_table").toDataSet[Row].print()
  }
}

Если вы запустите UdfExample.scala, он выдаст аналогичный результат следующим образом:

Without udf:
1535816823,1
1536272308,3
1536392928,2

With udf:
2018-09-01 18:47:03,1
2018-09-07 01:18:28,3
2018-09-08 10:48:48,2
0 голосов
/ 07 сентября 2018

Я думаю, что вы ищете DATE_FORMAT(timestamp, '%Y-%m-%d %H:%i:%s').

См. Документацию по встроенным функциям и спецификаторам формата даты для получения дополнительной информации.

...