Я только начинаю тему фреймворков для обработки потоковых данных в реальном времени, и у меня есть вопрос, на который я до сих пор не смог найти какого-либо окончательного ответа:
Делают ли обычные подозрения (Apache'sSpark, Kafka, Storm, Flink и т. Д.) Поддерживают обработку данных с разрешением времени события наносекунд (или даже пикосекунд)?
Большинство людей и документация говорят о разрешении в миллисекундах или микросекундах,но я не смог найти однозначного ответа, если будет возможно большее разрешение или проблема.Единственная структура, на которую я полагаю, чтобы иметь такую возможность, - это структура Kapacitor от infxData, так как их TSDB influenxDB, похоже, хранит временные метки с наносекундным разрешением.
Может ли кто-нибудь здесь предложить некоторую информацию об этом или даже некоторые информированные факты?Альтернативные решения / рамки, предлагающие эту возможность?
Что-нибудь будет высоко оценено!
Спасибо и всего наилучшего,
Саймон
Справочная информация о моем вопросеЯ работаю в среде с целым рядом запатентованных реализаций для хранения и обработки данных и думаю о некоторой организации / оптимизации в настоящее время.Мы проводим эксперименты по физике плазмы с множеством различных диагностических / измерительных систем с различной частотой дискретизации, в настоящее время до «выше гигабайтных выборок в секунду».Один общий факт / предположение в наших системах заключается в том, что каждый образец имеет записанное время события в наносекундном разрешении.При попытке использовать установленную потоковую (или также пакетную) среду обработки, мы должны будем сохранить это разрешение метки времени.Или пойти еще дальше, поскольку мы недавно нарушили порог 1 Gsps в некоторых системах.Отсюда и мой вопрос.