Учитывая
[('Project', 10),
("Alice's", 11),
('in', 401),
('Wonderland,', 3),
('Lewis', 10),
('Carroll', 4),
('', 2238),
('is', 10),
('use', 24),
('of', 596),
('anyone', 4),
('anywhere', 3),
, в котором значением парного СДР является частота слова.
Я хотел бы только вернуть слова, которые появляются 10 раз. Ожидаемый результат
[('Project', 10),
('Lewis', 10),
('is', 10)]
Я пытался использовать
rdd.filter(lambda words: (words,10)).collect()
Но он по-прежнему показывает весь список. Как мне go об этом?