Я пытаюсь использовать FLINK-CEP для измерения времени, в течение которого заявка на рынке занимает от BidState.OPEN
до BidState.Closed
. Я получаю DataStream предложений с идентификаторами и состояниями, и в настоящее время я сопоставляю все «ОТКРЫТЫЕ» предложения со всеми «ЗАКРЫТЫМИ» предложениями.
У меня есть условие в patternStream.process
, которое позволяет открывать и закрывать заявки с одинаковым идентификатором для парного соединения, как и должно быть. Это кажется неправильным, так как количество матчей растет невероятно быстро, и у меня есть ощущение, что это можно сделать с помощью шаблонов. Итак, есть ли способ убедиться, что оба "начальных" и "конечных" объекта имеют одинаковый идентификатор?
AfterMatchSkipStrategy skipStrategy = AfterMatchSkipStrategy.noSkip();
//Is it possible to make sure that start.BidID == end.BidID in the pattern?
Pattern<BidEvent, ?> pattern = Pattern.<BidEvent>begin("start", skipStrategy).where(
new SimpleCondition<BidEvent>() {
@Override
public boolean filter(BidEvent value) {
return value.getState() == BidState.OPENED;
}
}).followedByAny("end").where(
new SimpleCondition<BidEvent>() {
@Override
public boolean filter(BidEvent value) throws Exception {
return value.getState() == BidState.CLOSED; // && value.getBidID == start.getBidID?
}
}).within(timeout);
PatternStream<BidEvent> patternStream = CEP.pattern(BidEventDataStream, pattern);
patternStream.process(new PatternProcessFunction<BidEvent, MatchingDuration>() {
@Override
public void processMatch(Map<String
, List<BidEvent>> map
, Context context
, Collector<MatchingDuration> collector) {
BidEvent start = map.get("start").get(0);
BidEvent end = map.get("end").get(0);
if (start.getBidId() == end.getBidId()){ // Make sure opening and closing bid is the same. Can this be done in the pattern?
collector.collect(new MatchingDuration(start.getBidId(), (end.getTimestamp() - start.getTimestamp())));
}
}
}).addSink(matchingDurationSinkFunction);