Сопоставление нескольких строк с одним ключом в Spark - PullRequest
0 голосов
/ 04 января 2019

У меня есть текстовый файл, который выглядит (как-то) так:

1825:lots of words
1899:a few more words
2018:other words

Теперь я хочу создать что-то вроде хэш-карты, где в конце я выведу наиболее часто встречающиеся слова для 1, 2 и т. Д. Можно ли использовать один и тот же ключ для разных значений?

Мне очень трудно понять лямбда-строки и уменьшитьByKey.

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...