Как JSON данные вместо JSON пути в потоковой передаче Spark Structure - PullRequest
1 голос
/ 10 февраля 2020

У меня есть данные в переменной jsondata, как показано ниже [{'sno': 1, 'number': '000-00-00000'}]

Как использовать эти данные в JSON() во время потоковой передачи структуры в искре, которая фактически ожидает путь, которого у меня нет. Я пробовал приведенный ниже код, но выдал ошибку: TypeError: путь может быть только одной строкой

df=spark.readStream.json(jsondata)

Пожалуйста, помогите в этом.

1 Ответ

0 голосов
/ 10 февраля 2020

Поскольку переменная имеет тип dict, вам придется вывести ее в строку JSON, а затем создать DataFrame следующим образом:

import json

json_dict = [{'sno': 1, 'number': '000-00-00000'}]

json_string = json.dumps(json_dict)

df = spark.read.json(sc.parallelize([json_string]))
df.show()

#+------------+---+
#|      number|sno|
#+------------+---+
#|000-00-00000|  1|
#+------------+---+
...