Использование Scala: у меня есть таблица emp, как показано ниже
id, name, dept, address
1, a, 10, hyd
2, b, 10, blr
3, a, 5, chn
4, d, 2, hyd
5, a, 3, blr
6, b, 2, hyd
Код:
val inputFile = sc.textFile("hdfs:/user/edu/emp.txt");
val inputRdd = inputFile.map(iLine => (iLine.split(",")(0),
iLine.split(",")(1),
iLine.split(",")(3)
));
// filtering only few columns Now i want to pull hyd addressed employees complete data
Проблема: Я не хочу печатать все empподробности, я хочу напечатать только несколько подробностей emp, которые все из hyd.
- Я загрузил этот набор данных emp в Rdd
- Я разделил этот Rdd с помощью ','
- теперь я хочу печатать только по адресу emp.