Моделирование данных транзакции в FP-Growth с использованием pysaprk - PullRequest
0 голосов
/ 26 октября 2019

Я создал фрейм данных массивов, используя spark.sql и .toDF().

Мой код ошибки говорит Py4JJavaError: An error occurred while calling o375.fit. всякий раз, когда я пытаюсь соответствовать модели.

Вот мой следующий код:

df = spark.sql("select arrays from sql_df").toDF("items")
fpGrowth = FPGrowth(itemsCol="items", minSupport=0.001, minConfidence=0)
model = fpGrowth.fit(df)

Я вижу только документацию по scala. Пожалуйста, помогите.

...