Question

В одном из устаревших приложений, в БД - SQL Server 2016, у нас есть таблица - показатели

, в ней более 15 столбцов, один из столбцов - , двоичный

Когда я загружаю в Spark и печатаю схему, ее двоичный файл

scala> jdbcDF.printSchema()
root
 |-- measurementValues: binary (nullable = true)
 |-- measure: string (nullable = true)

Похоже, они использовали Hashtable , сериализовали его и сохранили в столбце таблицы как двоичный файл

Я пытаюсь десериализовать его обратно в Hashtable (или) Map (или) Some Collection можно преобразовать в JSON формат при выполнении операций ETL

Может кто-нибудь помочь здесь? Я пытался преобразовать двоичный файл в строку, но по-прежнему бесполезно: (

val convertToString = udf((a: Array[Byte])=> new String(a))

Sandeep540 · Answer 1 · 31 января 2020

  def deserializeBinary = udf((x: Array[Byte]) => {
    val stream: InputStream  = new ByteArrayInputStream(x);
    val obs = new ObjectInputStream(stream)
    val stock = obs.readObject.asInstanceOf[util.Hashtable[String, String]]
    stock
  })

Получить Hashtable / Map из Spark Dataframe Столбец, сохраненный как двоичный файл (сериализованный Hashtable) в SQL Server 2016 с использованием Apache Spark 2.4

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получить Hashtable / Map из Spark Dataframe Столбец, сохраненный как двоичный файл (сериализованный Hashtable) в SQL Server 2016 с использованием Apache Spark 2.4

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы