Не могу правильно настроить качество и дрейф мониторов - PullRequest
0 голосов
/ 05 февраля 2020

У меня действительно странная проблема. Итак, я создал модель через Modeler Flow с использованием Spark Environment. Был файл .csv, который содержит данные о клиентах банка, и эта модель должна была предсказать, есть ли риск дать этим людям кредит. После этого я развернул модель и попал в экземпляр OpenScale.

Итак, проблема в следующем:

Когда я настраиваю «Сведения о модели» , он просит указать поле из данных обучения файл, который содержит ответы, которые должны быть предсказаны моделью , он показывает мне, что есть только одно подходящее поле (и его правильное), это поле содержит строковые данные (Я ПОЛНОСТЬЮ УВЕРЕН В ЭТОМ !!) Затем оно просит указать столбец в выходных данных из модели Из выходных данных выберите функцию, которая содержит прогноз, сгенерированный развертыванием AI.

Существует три возможных столбца, два из которых имеют строковый тип и другой тип double, я выбираю средний, потому что этот столбец состоит из значений строковых предсказаний (Нет / Да)

Хорошо, все готово.

Go для монитора качества, и он показывает мне это сообщение Необходимые условия Проверка не удалась: метка столбца label в training_data_schema с ролью моделирования target имеет тип double другого типа, чем столбец $X-Risk в output_data_schema с ролью моделирования prediction типа string; Проверьте настройки label_column и prediction_field в asset_properties вашей подписки

Я действительно не знаю, как это исправить. Потому что я ЗНАЮ, что НИКАКОГО столбца с именем LABLE и, конечно, нет НИКАКОГО столбца с именем LABLE с ДВОЙНЫМ ТИПОМ !!

Помогите мне, пожалуйста !!

1 Ответ

1 голос
/ 05 февраля 2020

Поскольку вы создали модель искры, вы должны выполнить индексирование строк, пока модель обучения будет применяться даже для целевого столбца (он же столбец метки), что могло бы привести к обнаружению целевого столбца из данных обучения, чтобы быть двойной столбец, поэтому, пожалуйста, попробуйте выбрать столбец прогноза (который вы выбираете из выходных данных) в качестве числа (он же двойной столбец), и он должен решить вашу проблему в основном

...