Если вы используете python 3, вероятно, речь идет о распаковке кортежей , которая не поддерживается в python 3. Также вы можете проверить эту нить .
Допустим, у вас есть rdd из кортежей:
RDD = spark.sparkContext.range(0, 1).map(lambda a: (a, a))
приведенный ниже код завершится с SyntaxError: недопустимый синтаксис
RDD.map(lambda (a, b): a).collect()
, но это будет работать правильно:
RDD.map(lambda a: a[0]).collect()