В одном из устаревших приложений, в БД - SQL Server 2016, у нас есть таблица - показатели
, в ней более 15 столбцов, один из столбцов - , двоичный
Когда я загружаю в Spark и печатаю схему, ее двоичный файл
scala> jdbcDF.printSchema()
root
|-- measurementValues: binary (nullable = true)
|-- measure: string (nullable = true)
Похоже, они использовали Hashtable , сериализовали его и сохранили в столбце таблицы как двоичный файл
Я пытаюсь десериализовать его обратно в Hashtable (или) Map (или) Some Collection можно преобразовать в JSON формат при выполнении операций ETL
Может кто-нибудь помочь здесь? Я пытался преобразовать двоичный файл в строку, но по-прежнему бесполезно: (
val convertToString = udf((a: Array[Byte])=> new String(a))