PMML и PFA являются стандартами для представления моделей машинного обучения, а не конвейеров обработки данных. Модель машинного обучения принимает запись данных, выполняет некоторые вычисления и выдает запись выходных данных. Таким образом, по определению вы работаете с одной изолированной записью данных, а не с набором / фреймом / матрицей записей данных.
Если вам необходимо представить полные конвейеры обработки данных (где модель ML является лишь частью рабочего процесса), вам нужно искать другие / комбинированные стандарты. Возможно, SQL в сочетании с PMML будет хорошим выбором. Идея состоит в том, что вы хотите выполнить агрегирование данных вне модели ML, а не внутри нее (например, база данных SQL будет намного лучше, чем любая среда выполнения PMML или PFA) .