Вопрос о SPSS modeler (есть препятствие для автоматического запуска потока) - PullRequest
0 голосов
/ 10 октября 2018

У меня есть поток SPSSmodeler, который теперь постоянно используется и обновляется каждую неделю для создания определенного набора данных.Необработанные данные для этого потока также обновляются еженедельно.

В части этого потока есть множество узлов, которые необходимо было модифицировать и обновлять вручную каждую неделю, и последовательность этой частиниже: Тип Node => Узел реструктуризации => Узел агрегации

Чтобы упростить объяснение роли этих узлов, я нарисовал их изображение следующим образом:

enter image description here

Поскольку исходные необработанные данные изменяются еженедельно, диапазон значений, указанных выше, всегда варьируется, иногда более 6 (может быть, 100), другие - менее 6 (возможно, 3).Вот почему кто-то должен модифицировать там и обновлять эти узлы еженедельно до сих пор.* У единицы стоимости есть определенное ограничение (на данный момент 300)

Однако теперь мы стремимся запустить этот поток автоматически, не затрагивая какие-либо человеческие операции с ним, которые нам нужно настроить, чтобы он работал идеально, автоматически.Пожалуйста, помогите и оцените ваши усилия, спасибо!

Ответы [ 2 ]

0 голосов
/ 01 марта 2019

Я думаю, что есть лучшее, более простое и более эффективное (но рискованное, из-за требований узла к входным данным) решение вашей проблемы.Он называется Transpose node и делает именно это - поворачивает вашу таблицу.Но только с версии 18.1.Вот пример: https://developer.ibm.com/answers/questions/389161/how-does-new-feature-partial-transpose-work-in-sps/

0 голосов
/ 17 октября 2018

Для автоматизации я предлагаю попробовать использовать глобальные узлы в сочетании со скриптами clem внутри выполнения (скрипт по умолчанию).У меня есть поток, который вычисляет первую дату и последнюю дату, и эти переменные используются для переименования файлов в конце выполнения.Я думаю, вы могли бы использовать что-то подобное, как описано здесь:

1) Создать производные узлы для вывода значений единиц измерения, используемых в еженедельном потоке

2) Сохранить эту информацию в таблице с именем 'count_variable'

3) Используйте глобальный узел с именем Global с запросом, подобным следующему: @ GLOBAL_MAX (переменная, созданная в (2)) (только для записи количества переменных. Шаг 2 создантаблица только с 1 значением, поэтому GLOBAL_MAX будет содержать только количество переменных).

4) Запрос на вкладке выполнения будет выглядеть примерно так:


execute count_variable

var tabledata

var fn

set tabledata = count_variable.output

set count_variable = значение tabledata в 1 1

выполнить Global


5) Теперь вы можете использовать информацию о переменных, просто используя уже созданную "count_variable"

Это нелегко объяснить, просто набрав, но я надеюсь, что это было полезно.Пожалуйста, пометьте +1 в этом ответе, если он был релевантным.

...