У меня есть датафрейм. Мне нужно добавить массив [a, a, b, b, c, c, d, d,] в pyspark - PullRequest
0 голосов
/ 09 июля 2019

У меня есть фрейм данных df, у меня есть массив arr = [1,1,2,2,3,3,4,4]. Мне нужно добавить этот массив в существующий фрейм данных df.

Мой код выглядит следующим образом:

low_limit = 2011 
upper_limit = 2017 
arr = np.repeat(np.arange(low_limit,upper_limit),2) 
df = df.withColumn('arrayYear',F.array(F.lit(arr))).show() 

Я получаю эту ошибку Py4JJavaError:

An error occurred while calling z:org.apache.spark.sql.functions.lit. : 
java.lang.RuntimeException: Unsupported literal type class java.util.ArrayList [2011, 2011, 2012, 2012, 2013, 2013, 2014, 2014, 2015, 2015, 2016, 2016] at org.apache.spark.sql.catalyst.expressions.Literal$.apply(literals.scala:80) 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...