Давайте предположим, что у меня есть PCollection в следующем формате:
-----------------------------------------
| sale_id | product_id | amount |
|-----------|---------------|-----------|
| 1 | a | 1 |
|-----------|---------------|-----------|
| 2 | b | 12 |
|-----------|---------------|-----------|
| 3 | c | 3 |
|-----------|---------------|-----------|
| 4 | d | 100 |
|-----------|---------------|-----------|
| 5 | e | 4 |
-----------------------------------------
Моя цель состоит в том, чтобы фильтровать только X записей бестселлеров, т.е. порядок по количеству, ограничение X
Каков путь ксделать это в Apache Beam?
Спасибо!