Я хотел бы получить некоторую информацию о том, как использовать TFX, если мой подход был правильным.
Моя конечная цель состояла в том, чтобы сделать некоторые прогнозы для необработанного потока последовательных данных, которые требовали некоторой предварительной обработки.
Обычно у нас есть нестабильные задания, выполняющие базовый анализ, такой как управление окнами, группировка и вычислительная статистика.
Однако предполагалось перенести эти конвейеры в пучок и заставить TFX использовать эти компоненты пучка для дальнейших вычислений.
Это оказалось довольно сложной задачей, поскольку компоненты TFX имеют строгий API и ожидают, что все промежуточные данные будут TFRecords.
Таким образом, мой вопрос заключается в том, стремится ли TFX обрабатывать всю логику предварительной обработки (группирование, управление окнами и т. Д.) Или это больше для инженерии данных?