Мое задание луча / потока данных начинается с одной записи состояния c, переданной следующим образом:
Pipeline p = Pipeline.create(options);
PCollection<String> initValue = p.apply(Create.of("MyStringValue"));
Однако, когда я запускаю его (в DataflowRunner), узел Create, созданный этим оператором, генерирует несколько ценности. Чем дольше я жду, тем больше раз оно выдает одно значение:
Это не похоже на артефакт, как позже в конвейере I получить дубликаты / дубликаты / .. элементы. Beam также регистрирует предупреждение:
Can't verify serialized elements of type BoundedSource have well defined equals method. This may produce incorrect results on some PipelineRunner
Как мне сделать, чтобы мой Create.of с одним значением выдавал только одно значение в конвейер? Нужно ли присоединять метод equals или указывать его на метод equals для строковых значений (если да, то как)!?