не использовать сбор RDD - PullRequest
0 голосов
/ 03 мая 2020

Пожалуйста, кто-нибудь знает, в чем ошибка в этой строке кода? Потратьте часы на поиски, но не удалось это исправить. Заранее спасибо,

labels = RDD.map(lambda (a, b): a).collect()

Синтаксическая ошибка

1 Ответ

0 голосов
/ 03 мая 2020

Если вы используете python 3, вероятно, речь идет о распаковке кортежей , которая не поддерживается в python 3. Также вы можете проверить эту нить .

Допустим, у вас есть rdd из кортежей:

RDD = spark.sparkContext.range(0, 1).map(lambda a: (a, a))

приведенный ниже код завершится с SyntaxError: недопустимый синтаксис

RDD.map(lambda (a, b): a).collect()

, но это будет работать правильно:

RDD.map(lambda a: a[0]).collect()
...