У меня есть список списков с токенами, такими как:
mylist = [['hello'],
['cat'],
['dog'],
['hey'],
['dog'],
['I', 'need', 'coffee'],
['dance'],
['dream', 'job']]
myRDD = sc.parallelize(mylist)
Я изо всех сил пытаюсь найти операцию, которая приведет к RDD, где каждая строка - один токен. Мой желаемый вывод:
[['hello'],
['cat'],
['dog'],
['hey'],
['dog'],
['I'],
['need'],
['coffee'],
['dance'],
['dream'],
['job']]
Какой синтаксис подходит для этого? Спасибо