PySpark - невозможно объединить два элемента из одного и того же RDD - PullRequest
0 голосов
/ 08 декабря 2018

У меня есть RDD (данные) со следующими элементами: first_name, last_name, technology

[u'Army', u'Dall', u'java']
[u'Fredy', u'Monty', u'C']
[u'John', u'Cabral', u'R']
[u'Mathy', u'Gauld', u'Python']

Я пытаюсь получить:

[u'Army Dall', u'java']
[u'Fredy Monty', u'C']
[u'John Cabral', u'R']
[u'Mathy Gauld', u'Python']

В порядкечтобы получить это я пытаюсь с:

data.glom().map(lambda line: (line[0]+ " " + line[1])).collect()

Однако я получаю эту ошибку:

TypeError: can only concatenate list (not "str") to list

Кто-нибудь знает, как решить эту проблему?

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...