Я пытаюсь получить самую старую ячейку определенной строки в BigTable в моем конвейере DataFlow (используя Beam SDK 2.4.0). Однако я не могу найти какой-либо тип фильтра, который позволил бы мне сделать это?
Далее по конвейеру значение самой старой ячейки будет использоваться вместе с самой новой ячейкой и записываться в BigQuery. Это то, что у меня есть для получения самой последней ячейки:
input.apply("Read protos from BigTable", BigtableIO.read()
.withProjectId(config.getBigtableProject())
.withInstanceId(config.getBigtableInstance())
.withTableId(this.bigTableId)
.withRowFilter(RowFilter.newBuilder()
.setFamilyNameRegexFilter("proto")
.setCellsPerColumnLimitFilter(1)
.build()))
.apply("Row to TableRow", ParDo.of(new DoFn<Row, TableRow>() { ...
Я ожидаю, что будет нечто подобное, выбрав 1 ячейку, но в обратном порядке?
Есть идеи?