Я использую Java 8 для своей искровой работы.
У меня есть класс ниже, который мне нужно обработать:
public class MyModel implements Serializable {
private String region;
private String keyword;
private Long termFrequency;
}
Я применил обработку ниже:
JavaRDD<MyModel> processedRows =
csvLines
.filter(myFilterObj)
.map(myMapObj);
Что дает мне результат ниже:
region | keyword | termFrequency
--------------------------------
REGION1 | milk | 200
REGION2 | lemon | 100
REGION1 | milk | 100
Я хочу сгруппировать свои записи по region
и keyword
, добавить termFrequency
и получить результат вывода, как показано ниже:
region | keyword | termFrequency
--------------------------------
REGION1 | milk | 300
REGION2 | lemon | 100
Как этого добиться в JavaRDD?