Преобразовать словарь в фрейм данных в pyspark для ключа Unicode и списка значений с плавающей запятой - PullRequest
0 голосов
/ 29 августа 2018

У меня есть экземпляр словаря, который имеет Unicode (использует UTF-8) ключ и значение в качестве списка значений с плавающей запятой. Когда я бегу ниже код:

dictDF = sc.parallelize(mapOfVectors).toDF()

Сбой с ошибкой: Невозможно вывести схему для типа: введите 'unicode' при преобразовании RDD в DataFrame.

Может кто-нибудь подсказать, как это можно сделать?

1 Ответ

0 голосов
/ 29 августа 2018

Попробуйте использовать pandas.DataFrame.from_dict :

import pandas as pd
dictDF = pandas.DataFrame.from_dict(sc.parallelize(mapOfVectors))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...