Из очень неопределенного описания, я полагаю, что вам потребуется что-то вроде следующего, при условии, что input
имеет тип JavaRDD<Row>
:
final Row min = input.min((row1, row2) -> {
// TODO: replace by some real comparator implementation
Integer row1value = row1.getInt(row1.fieldIndex("fieldName"));
Integer row2value = row2.getInt(row2.fieldIndex("fieldName"));
return row1value.compareTo(row2value);
});
items = input.filter(row -> !Domine(row, min));
Sine ApacheSPARK Преобразования типа filter
по своей природе ленивы, чтобы на самом деле получить значение, которое вам нужно было бы написать List collectedValues = items.collect();
Я бы, однако, настоятельно рекомендовал бы, чтобы .collect()
никогда не поступал в производство, поскольку это действительно может быть очень опасно.